(완료) AI - 사법시스템

분쟁을 해결하거나 억누르는 물리적인 수단인 사법시스템은 법조3륜인 판사, 검사 및 변호사를 주된 축으로 하고, 그를 보조하는 다양한 직군의 인력에 의해 운영되는 사회적 기구이며, 통상적으로 경찰에 의한 조사 단계, 검찰에 의한 수사와 기소 단계, 법원에 의한 판결 단계로 진행됩니다. 2018년 현재, AI를 적용하려는 노력은 주로 변호사 업무를 보조하는, 구체적으로는 변호사의 자료 조사 업무를 보조하는데 집중하며, 기반 기술은 정보 추출입니다.

연구기관마다 접근 방식과 방향이 상이하지만, 미국와 영국 등의 선두 그룹(IBM, Google, Apple, Facebook)은 사법시스템에 종사하는 인적 자원을 보조하는 자연어처리 기술(NLP: Natural Language Processing)과 정보 추출(Information Retrieval)에 초점을 둡니다. 아래 글들을 참조하십시오.

Blue Hill Benchmark Report - Artificial Intelligence in Legal Research

IBM Watson - Build Your Cognitive Business with IBM

IBM Natural Language Classifier

Cloud Natural Language API | Google Cloud Platform

한편, AI 사법시스템 개발은 판례를 포함하여 관련 데이터가 충분하므로, 여타 AI 시스템보다 훨씬 유리합니다. 이 글에서는 형사 사건을 예로서, 종래의 사법시스템을 보조할 1차 사법기관으로써 AI 사법시스템의 작성 방법과 절차를 기술합니다. 가령, AI 사법시스템이 1심 판결을 담당하고, 종래의 판, 검, 변호사로 구성된 인적 사법시스템이 2심과 3심을 담당하는 구조를 생각해 볼 수 있습니다.

기존의 사법 시스템 내에서도 범죄 사실의 포착과 판결, 판결 결과의 집행이 자동적으로 진행되는 영역이 있는데, 교통단속 카메라가 대표적입니다. AI 사법시스템이 지향하는 바는 그러한 자동적 사법 처리 과정을 교통단속뿐 아니라, 모든 종류의 범죄와 소송으로 확대하여, AI가 1심 판결을 담당하게 하는 것입니다.

외부이미지

편의상 네 단계를 나눠 기술합니다.

첫 단계는 종래의 판례를 수집하여, 사건 각각을 6하 원칙 또는 여타 프레임으로 재구성하는 작업입니다. 예를 들어, 판례집에 수록된 2017년 현재까지 미국에서 진행된 모든 사건 각각을 6하 원칙으로 기술한 DB를 작성한 뒤, 전형적인 정보 추출(IR) 기법을 적용할 수 있습니다. 가령, 1억 건의 판례를 일정한 양식으로 DB에 담을 수 있습니다. IR 기법은 아래 강의를 참조하십시오. 2~3시간 학습 분량입니다.

Information Retrieval

아쉽지만, 고려대와 KAIST 등이 분발하고 있긴 하지만, 한국어에 기반을 둔 AI 사법시스템을 가능하게 할 정도로 한국어 자연어처리기술이 진보한 상태는 아닙니다. 따라서, 한국에 적용할 AI 사법시스템을 개발하려면, 두 가지 방안있는데, 첫째, 한국어 판례를 전부 영문으로 번역한 뒤, 그를 기반으로 AI 시스템을 작성하고, 한국에서 발생하는 사건마다 영문으로 번역하여 판결을 구하는 방법, 둘째, 그냥 미국법으로 한국법을 통채로 바꾸는 방법입니다. 전자는 그럴 비용과 인력이 부족하고, 후자는 대륙법과 영미법 간의 구조 차이로 불가능합니다. 한편으로는, 구글 번역기술이 일취월장 중이므로, 2~3년 뒤에는 전자의 방안이 고려될 수 있고, 다른 한 편으로는 과거 각 국가별로 상이하게 운용되던 회계 기준이 국제 표준(사실상 미국 표준)으로 통일된 것처럼, 한국의 법규 역시 미국의 법규와 유사한 형태로 진화할 가능성이 있습니다(가령, 국민배심제).

둘째 단계는 실제 AI 코딩을 진행하는 단계입니다. DB의 각 아이템(누가 언제 어디서 무엇을 어떻게 왜)을 Input으로 하고, 그에 대한 판결 또는 조정 결과(징역 1년, 화해 권고 등)를 Output으로 하는 신경망을 구성합니다. 앞서 구성한 1억 건의 판례에서 임의로 1,000,000건을 선정하여, 신경망을 훈련한 뒤, 나머지 판례에 실증하는 작업을 반복할 수 있습니다. 전술하였듯이, 판례집에 수록된 사건들의 수가 엄청나므로, 개발자들은 밀려드는 행복을 주체할 수 없을 지도 모릅니다.

누가	언제	어디서	무엇을	어떻게	왜	판결
XXX	오전 10시	직장	장비	훔침	금전	징역 1년

그런데, 1억 건의 사건이 있었다 해도, 완전히 같은 사건은 없으므로, 사건들 간의 유사성을 어떻게 결정할 것인가 하는 문제가 남습니다. 일반적인 머신러닝은 대상의 유사성을 길이와 색상 등의 속성으로 결정하는데, ‘훔쳤다', ‘때렸다'와 같은 ‘단어’는 길이도 색깔도 없으므로, ‘훔쳤다'라는 단어와 ‘맛있다' 및 ‘달렸다'라는 단어들 간의 유사성을 어떻게 측정하는 지에 대한 문제가 제기됩니다. 가령, ‘홍길동이 성춘향을 팬티를 훔쳐서 푸른 기왓집에 보관하다가 특검에 걸렸다’는 사건이 아래 두 사건 중 어떤 사건과 더 유사한 지를 신경망이 결정할 수 있어야 합니다.

임꺽정이 슈퍼맨을 폭행하여 슈퍼맨의 팬티가 찢어졌다(그러게 왜 팬티를 바지 밖에 입나…) - 징역 6개월.
곽한구가 BMW를 훔쳐 타고가다 결렸다 - 징역 1년, 집행 유예 2년

이처럼 단어들 간의 유사성을 측정하는 것이 신경망 작성의 핵심인데, 그간의 연구 성과가 꽤 훌륭합니다. 이 부분의 이해, 즉, 자연어 처리(NLP)에 대한 이해는 아래 강의를 참조하십시오. 현업 종사자가 강의하므로, 현장감이 좋습니다(게다가 잘생기기까지). 언어학 및 프로그래밍 배경 지식이 있으면 강의가 더욱 재밌습니다.

Stanford University CS224d: Deep Learning for NLP(7~15일 학습 분량)

단어들 간의 유사성을 판단할 기준이 수립되면, 사건에 대한 판례가 충분하므로, 만족할 만한 성능을 보일 때까지 신경망 훈련을 지속할 수 있습니다. 훈련을 마친 ANN은 새로이 발생한 사건, 그 결과값을 ‘확률적으로 참조’하여, 새로운 판결 값을 도출할 수 있을 것입니다. ‘확률적 참조’란 새로운 사건A가 이전의 사건B와 70% 유사하고, 이전의 사건C와 30% 유사하면, 사건A의 형량은 사건B의 형량에 0.7을 곱한 값과 사건C의 형량에 0.3을 곱한 값을 더한다는 등의 계산 과정을 지칭합니다. 물론, 실제 시스템이 이처럼 단순하지는 않겠지만, 기본 메커니즘은 크게 다르지 않을 것입니다.

세번 째 단계는 범죄 사실을 포착할 기술적 방안을 수립하는 것입니다. 예를 들어, 대형 마트의 매장에 CCTV를 설치하고, AI의 이미지 처리 기술을 이용하여 절도 현장을 자동으로 포착하게 하는 등입니다. 이 기술은 별로 새로운 것은 아닌데, 이미 유사한 기술이 광범위하게 이용되고 있습니다. 과속 및 신호 위반 차량을 포착하는 도로 위의 CCTV가 그 예입니다. CCTV 외에도 범죄 사건을 인지할 다양한 장치와 시설을 고안할 수 있습니다. 다른 예로는, 시민 X가 친분이 없는 다른 시민Y에게 많은 금액을 송금한다면, 보이스피싱으로 의심할 수 있고, 하루에도 수백 만 건이 발생하는 송금 중에서 비정상적 송금을 포착할 ANN을 구성할 수 있습니다. 비정상적 사건의 포착 방법에 대한 개요는 아래 프리젠테이션을 참조하십시오.

Anomaly Detection 101 - Elizabeth (Betsy) Nichols Ph.D.(20분 분량)

이상으로 자연어처리 기술과 정보 추출 기술에 기초한 AI 사법시스템의 작성할 한 가지 방법을 간략히 살펴보았습니다. 학습자가 자연어처리 기술을 익히고 이용하기까지는 많은 시간이 소요됩니다. 이 분야에 종사하려면, AI 학부 과정 3년을 마친 뒤, 박사 과정 3년을 더 이수하는 것이 바람직합니다.