AFEX 시스템 제작 과정은 사람이 하는 일과 시스템이 하는 일로 나뉘는데, 사람이 하는 일의 첫 단계는 지식의 절대 지도를 작성하는 것입니다.
사람인 우리가 만 4살부터 약 20년간 걸쳐 학습할 다양한 과목의 지식들을 아주 작은 지식 셀(K-Cell)로 분할한 다음, 각 셀마다 고유한 아이디를 부여합니다. 그러면, 그 이면에서 시스템이 아주 놀라운 일을 진행합니다.
AFEX는 인공지능 전문가를 양성하기 위한 인공지능 시스템입니다. 인공이든 자연이든 누군가를 가르치기 위해서는 컨텐츠가 필요합니다. 만 4살에 정규 교육을 시작하여, 만 22세 전후에 박사 과정까지 마치는 표준 과정을 기준으로 학습자가 배워야 할 과목은 영어, 수학, 물리, 화학 등 19개이고, 각 과목마다 연령 별로 다른 강의를 제공하므로, 전체 강좌의 수는 150~200개입니다. 예를 들어, 수학 부문은 만 4세에 배우는 산수, 5세에 배우는 산수 … 17세에 배우는 수학까지 30여 강좌로 구성될 수 있습니다. 또한, 하나의 강좌는 100여 시간의 강의로 구성됩니다. 수학 등 하나의 과목이 연령대 별로 제공되는 다수의 강좌로 구성되고, 하나의 강좌는 평균 1시간 전후의 여러 강의로 구성되므로, ‘과목 => 강좌 => 강의’의 피라미드 구조입니다.
네 살부터 스물 남짓까지 공부할 과목들을 연령대 별 강좌로 분류한 다음, 각 과목 및 강좌의 컨텐츠를 수집합니다. 영어권 대학과 온라인 기관이 공개하는 강의가 국내보다 상대적으로 풍부합니다. 예를 들어, 11년 차(K11)에 배워야할 과목들과 각 과목의 강좌들은 그림과 같습니다.
그 다음 각 강좌의 강의를 3분 단위로 분할합니다. 3분 이내의 길이라는 게 무척 중요한데, 그 이유는 질문답변 시스템과 관련있습니다. 아래 그림은 정규 교육 5~6년차(K5~K6)에 학습할 수학 과목의 대수 강의를 3분 단위로 분할한 것인데, 스탠포드 AI 교수인 Sebastian Thrun 교수가 설립한 Udacity의 공개 강좌입니다. 무인자율주행 차량을 최초로 제대로 만든 사람이죠.
모든 강좌의 모든 강의를 이처럼 3분 길이로 분할하면, 각 강좌는 수백 ~ 수천 개의 ‘3분 길이 강의'의 집합이 됩니다. ‘3분 길이 강의'를 지식 셀(Knowledge Cell, K-Cell)이라 부르는데, 학습 연령을 x 축, 과목 또는 강좌를 y 축, 그리고 일련번호를 z 축에 두면, 매우 거대한 입체 구조가 만들어지죠.
아래 시트의 셀(Cell) 각각이 지식 셀(K-Cell)인데, 인공지능 전문가가 되기 위해 배워야할 셀의 수는 약 150,000개 전후입니다. 각각의 지식 셀이 고유한 아이디(ID)를 갖는 점에 주목해야 합니다. 이게 지식의 절대 주소(Absolute Address)입니다. 예를 들어, 정규학습 10년차(K11)에 수학 과목(B)의 1,000번째 지식 셀은 ‘K11B1000’일 수 있습니다.
2017년 3월 현재까지 약 7만 개의 지식 셀을 ‘순서대로’ 수집 및 정리했습니다. 앞으로도 약 8만 개를 더 수집하고 정리해야 하는데, 특히, 유치원과 초등 저학년(K1~K4) 연령대의 학습 컨텐츠를 수집하기가 쉽지 않군요.
지금까지 작성한 것이 지식의 절대 지도입니다. 다음 편에서는 지식의 절대 지도 뒷편에서 시스템이 어떤 놀라운 일을 진행하는 지 간략히 알아보겠습니다.