Published using Google Docs
상대적이고 절대적인 지식의 지도(3/10)
Updated automatically every 5 minutes

AFEX 시스템 제작 과정은 사람이 하는 일과 시스템이 하는 일로 나뉘는데, 사람이 하는 일의 첫 단계는 지식의 절대 지도를 작성하는 것입니다.

사람인 우리가 만 4살부터 약 20년간 걸쳐 학습할 다양한 과목의 지식들을 아주 작은 지식 셀(K-Cell)로 분할한 다음, 각 셀마다 고유한 아이디를 부여합니다. 그러면, 그 이면에서 시스템이 아주 놀라운 일을 진행합니다.


AFEX는 인공지능 전문가를 양성하기 위한 인공지능 시스템입니다. 인공이든 자연이든 누군가를 가르치기 위해서는 컨텐츠가 필요합니다. 만 4살에 정규 교육을 시작하여, 만 22세 전후에 박사 과정까지 마치는 표준 과정을 기준으로 학습자가 배워야 할 과목은 영어, 수학, 물리, 화학 등 19개이고, 각 과목마다 연령 별로 다른 강의를 제공하므로, 전체 강좌의 수는 150~200개입니다.  예를 들어, 수학 부문은 만 4세에 배우는 산수, 5세에 배우는 산수 …  17세에 배우는 수학까지 30여 강좌로 구성될 수 있습니다. 또한, 하나의 강좌는 100여 시간의 강의로 구성됩니다. 수학 등 하나의 과목이 연령대 별로 제공되는 다수의 강좌로 구성되고, 하나의 강좌는 평균 1시간 전후의 여러 강의로 구성되므로, ‘과목 => 강좌 => 강의’의 피라미드 구조입니다.  

연령별 학습 과목 및 강좌

네 살부터 스물 남짓까지 공부할 과목들을 연령대 별 강좌로 분류한 다음, 각 과목 및 강좌의 컨텐츠를 수집합니다. 영어권 대학과 온라인 기관이 공개하는 강의가 국내보다 상대적으로 풍부합니다. 예를 들어, 11년 차(K11)에 배워야할 과목들과 각 과목의 강좌들은 그림과 같습니다.

Screen Shot 2017-03-09 at 5.11.31 AM.jpg

그 다음 각 강좌의 강의를 3분 단위로 분할합니다. 3분 이내의 길이라는 게 무척 중요한데, 그 이유는 질문답변 시스템과 관련있습니다. 아래 그림은 정규 교육 5~6년차(K5~K6)에 학습할 수학 과목의 대수 강의를 3분 단위로 분할한 것인데, 스탠포드 AI 교수인 Sebastian Thrun 교수가 설립한 Udacity의 공개 강좌입니다.  무인자율주행 차량을 최초로 제대로 만든 사람이죠.

 Screen Shot 2017-03-09 at 5.14.30 AM.jpg

모든 강좌의 모든 강의를 이처럼 3분 길이로 분할하면, 각 강좌는 수백 ~ 수천 개의 ‘3분 길이 강의'의 집합이 됩니다. ‘3분 길이 강의'를 지식 셀(Knowledge Cell, K-Cell)이라 부르는데, 학습 연령을 x 축, 과목 또는 강좌를 y 축, 그리고 일련번호를 z 축에 두면, 매우 거대한 입체 구조가 만들어지죠.  

아래 시트의 셀(Cell) 각각이 지식 셀(K-Cell)인데, 인공지능 전문가가 되기 위해 배워야할 셀의 수는 약 150,000개 전후입니다. 각각의 지식 셀이 고유한 아이디(ID)를 갖는 점에 주목해야 합니다. 이게 지식의 절대 주소(Absolute Address)입니다. 예를 들어, 정규학습 10년차(K11)에 수학 과목(B)의 1,000번째 지식 셀은 ‘K11B1000’일 수 있습니다.

 2017년 3월 현재까지 약 7만 개의 지식 셀을 ‘순서대로’ 수집 및 정리했습니다. 앞으로도 약 8만 개를 더 수집하고 정리해야 하는데, 특히, 유치원과 초등 저학년(K1~K4) 연령대의 학습 컨텐츠를 수집하기가 쉽지 않군요.

Screen Shot 2017-03-09 at 5.34.48 AM.jpg

지금까지 작성한 것이 지식의 절대 지도입니다. 다음 편에서는 지식의 절대 지도 뒷편에서 시스템이 어떤 놀라운 일을 진행하는 지 간략히 알아보겠습니다.