AI에게 몬스터 진단법을 가르치며 깨달은 인간 추론의 본질

keyword_112

나는 얼마 전 아주 엉뚱한 실험 하나를 시작했다. 평소 즐겨 하던 판타지 RPG 게임의 방대한 몬스터 도감을 보다가, 문득 이 가상의 생태계 속 증상들을 기반으로 몬스터의 종류와 상태를 맞히는 ‘진단 AI’를 만들 수 없을까 하는 호기심이 생겼기 때문이다. 단순히 이름을 검색하는 것이 아니라, “피부가 푸른빛을 띠고 있으며 주변 온도를 급격히 낮추는 냉기를 내뿜는다”라는 묘사만으로 그것이 ‘프로스트 자이언트’인지 ‘아이스 드레이크’인지 구분해내는 논리 구조를 설계하고 싶었다.

가상의 질병과 증상, 데이터셋의 구축

처음에는 단순히 몬스터의 이름과 특징을 나열한 리스트를 AI에게 학습시키면 될 줄 알았다. 하지만 결과는 처참했다. AI는 단순히 키워드 매칭 방식에 의존했고, “불을 뿜는다”라는 문장이 나오면 무조건 ‘레드 드래곤’이라고 답했다. 하지만 게임 속에는 불을 뿜는 하급 임프나 화염 정령 같은 수많은 변수가 존재했다. 나는 여기서 ‘증상 기반의 계층적 추론’이라는 개념을 도입하기로 했다.

나는 몬스터의 특징을 세 가지 레이어로 나누어 정리했다. 첫 번째는 외형적 징후(피부색, 크기, 뿔의 유무), 두 번째는 행동적 패턴(공격 방식, 이동 속도), 세 번째는 환경적 요인(서식지, 주변 마나 농도)이었다. 이렇게 데이터를 구조화하자 AI는 단순한 단어 찾기가 아니라, 여러 조건이 동시에 충족될 때 결론을 내리는 일종의 ‘진단 프로세스’를 흉내 내기 시작했다.

추론의 함정: AI가 겪은 ‘상식’의 부재

실험 과정에서 가장 흥미로웠던 점은 AI가 범하는 오류의 패턴이었다. 예를 들어, “날개가 있고 하늘을 날며 불을 뿜는다”라는 묘사를 주었을 때, AI는 논리적으로 완벽하게 ‘드래곤’이라고 진단했다. 하지만 내가 “그 생물은 몸길이가 30cm에 불과하다”라는 결정적인 단서를 추가하자 AI는 일시적인 혼란에 빠졌다. 드래곤은 거대하다는 ‘상식’과 30cm라는 ‘데이터’가 충돌했기 때문이다.

이 지점에서 나는 인간의 추론 방식이 얼마나 많은 암묵적 전제 위에 세워져 있는지를 깨달았다. 우리는 ‘드래곤’이라는 단어를 들을 때 자동으로 ‘거대함’이라는 속성을 연결하지만, AI에게는 그 연결 고리를 명시적으로 가르쳐주지 않는 한 그저 서로 다른 두 개의 데이터 포인트일 뿐이었다. 나는 AI에게 ‘크기’라는 변수가 종의 분류에서 얼마나 결정적인 가중치를 가지는지 다시 설정해야 했다.

논리의 체계화와 진단의 정교함

나는 AI가 더 정교하게 진단할 수 있도록 ‘소거법’ 기반의 프롬프트를 설계했다. 먼저 가장 큰 범주인 ‘원소 속성’을 결정하고, 그다음 ‘지능 수준’, 마지막으로 ‘세부 외형’ 순으로 좁혀 들어가는 방식이었다. 마치 의사가 환자의 증상을 듣고 내과인지 외과인지 먼저 결정한 뒤 세부 질병을 찾아가는 과정과 비슷했다.

이 과정을 통해 AI는 놀라운 능력을 보여주기 시작했다. “숲속에서 발견되었으며, 몸에서 은은한 빛이 나고, 주변 식물들이 빠르게 성장한다”라는 모호한 묘사를 던졌을 때, AI는 먼저 ‘자연 속성’을 분류하고, ‘치유/성장’이라는 키워드를 포착해 최종적으로 ‘에인션트 트리 가디언’이라는 결론을 도출해냈다. 단순히 데이터를 매칭하는 것이 아니라, 주어진 단서들 사이의 관계성을 파악하기 시작한 것이다.

몬스터 진단이 나에게 가르쳐준 것들

가상의 몬스터를 진단하는 이 사소한 프로젝트는 역설적으로 인간의 사고방식에 대해 깊은 통찰을 주었다. 우리는 스스로를 매우 논리적인 존재라고 생각하지만, 사실 우리의 추론은 수많은 편견과 경험적 직관, 그리고 생략된 전제들로 가득 차 있다. AI에게 논리를 가르치기 위해 나는 내가 당연하게 여겼던 ‘상식’들을 하나하나 분해해서 언어로 정의해야 했고, 그 과정에서 내 사고의 빈틈을 발견할 수 있었다.

결국 지능이란 단순히 정보를 많이 가진 상태가 아니라, 정보와 정보 사이의 연결 고리를 얼마나 정교하게 설계하느냐의 문제라는 생각이 들었다. AI가 몬스터를 정확히 진단하게 된 것은 내가 더 많은 데이터를 넣었기 때문이 아니라, ‘생각하는 순서’를 가르쳤기 때문이었다.

앞으로의 실험과 질문

이제 나는 이 진단 모델을 확장해, 몬스터의 상태(분노, 허기, 질병 등)까지 판별하는 시스템을 만들어보려 한다. 단순한 종 분류를 넘어 ‘심리 상태’라는 보이지 않는 변수를 어떻게 데이터화하고 추론하게 만들 수 있을지가 다음 과제다.

문득 궁금해진다. 우리가 일상에서 내리는 수많은 판단과 결정들 중, 과연 얼마나 많은 부분이 AI처럼 정교한 논리에 기반하고 있을까? 아니면 우리 역시 그저 익숙한 패턴에 의존해 ‘그럴듯한 진단’을 내리고 있는 것은 아닐까? 여러분이 믿고 있는 그 ‘직관’이라는 이름의 논리는 얼마나 견고한지 한 번쯤 생각해보게 되는 밤이다.

댓글 남기기