여러 학교에서 여러 선생님들이 미적분을 가르치고 있습니다. 같은 주제를 여러 장소에서 반복적으로 강의하는 것은 귀중한 인적 자원의 낭비입니다.

지식과 지식셀 간의 1:1 매칭


지식셀(Knowledge Cell)은 평균 3분짜리 동영상 강의로, 구글 Sheets의 어느 한 셀에 기록됩니다. 과목에 따라 수천 개의 지식셀을 해당 과목의 Sheet에 일렬 종대로 나열합니다. 구글 Sheets는 인공지능 시스템을 개발하고 운용하기에 이상적인 환경인데, 너무 좋아서 감격의 눈물이 흐를 정도입니다. 이 주제는 별도의 글에서 자세히 기술하겠습니다.

AFEX 시스템의 주요한 특징 중 하나로, 하나의 주제에 대응하는 오직 하나의 지식셀(K-Cell)이 있습니다. 가령, 수학의 선형 대수(Linear Algebra) 강의는 오직 하나만 있고, 선형 대수 내의 Matrix Multiplication을 설명하는 동영상 강의, 즉, 지식셀(Knowledge Cell)은 오직 하나만 있습니다. 유치원 산수, 초등학교 산수, 중고등학교 수학 및 대학 수학을 포괄하는 30여 과목 각각의 강의를 3분 단위로 분할한 총 4,000여 지식셀은 제각기 고유한 주제를 다루는 동영상 강의이며, 그 중 중복되는 주제는 없습니다. 마치 사전(Dictionary)과 같습니다. 수만 개 어휘가 수록되지만, 하나의 어휘가 여러 장소에 중복게재 되지는 않습니다.

어느 한 분야의 지식을 서로 중복되지 않는 다수의 지식셀로 재구성하는 것은 힘들지만 가치있는 작업입니다. 예를 들어, 인공지능과 관련하여 Stanford, Berkeley 등이 공개한 강의들은 모두 인공지능이라는 하나의 주제를 공유합니다. 달리 표현하면, 인공지능 분야에 속하는 지식들입니다. 그런데, 서로 다른 장소에서 다른 교수들이 수업을 진행하므로, 일부는 중복되고 일부는 다른 내용입니다. 만약, 스탠포드 CS231n이 제공하는 80분 분량의 강의 23개를 3분짜리 지식셀 500여 개로 분할하고, 같은 과정을 MIT, Harvard, Yale, Berkeley, CMU, Oxford 등 여타 대학의 머신러닝 강의에 적용한 뒤, 그 주제나 내용이 상호 중복되는 지식셀을 소거하고, 난이도와 학습 순서에 따라 재배열한다면, 그 이점은 다음과 같습니다.  

3b533e59028ab756e12efd65b5082d27_building-blocks-personal-business-building-blocks-clipart_400-258.jpeg

먼저, 학습하는 사람 입장에서,

첫째, 산술적으로 총 20,000개의 지식셀을 5,000개 전후로 줄일 수 있으므로 학습자의 부담이 크게 줄어듭니다.

둘째, 중구난방의 강의들을 난이도와 논리의 흐름에 따라 재배열함으로써, 학습자가 공부해 나갈 주제들 간의 순서를 매길 수 있습니다.

그 다음, AFEX 시스템 입장에서,

첫째, AFEX가 다룰 수 있는 상태가 됩니다. 즉, 어디에 어떤 주제의 어떤 강의가 있는 지 세밀하게 파악하고, 질문 답변 알고리즘을 학습(machine learning)할 수 있습니다.

둘째, 학습자 각각의 능력과 성향, 취향, 학습에 대한 열의 등에 따라 일련의 그룹으로 분류하고, 이상적인 학습 효과를 낼 수 있는 스터디 팀을 구성할 수 있습니다. 예를 들어, 10,000명의 학습자들이 80분짜리 강의 100개를 듣는 경우와 3분짜리 강의(지식셀) 3,000개를 수강하는 경우를 비교하면, 후자가 훨씬 더 많은 정보를 AFEX에게 제공합니다. 인공지능은 결국 데이터이므로, 데이터를 많이 수집할 수 있는 여건일수록 시스템의 성능은 빠르게 향상됩니다.

Slide_2.gif