1
How to grade problem?
450개
10000개
Our Project
데이터 부족 문제
Zero data로 시작하는 프로젝트이며 인공 데이터 450개를 만들었지만 일반적인 인공지능 프로젝트에 비해 현저히 부족한 데이터 개수
라벨링의 공수 문제
라벨링에 들어가는 공수가 굉장히 크므로 최소한의 데이터로 최대한의 효과가 필요
Normally AI Project
2
1
3
2
4
문제 추가 및 수정
서술형 유저 답변 검수
서술형 유저 답변 라벨링
유저 관리
인공지능의 핵심은 데이터
라벨링과 검수를 편리하게 가능
데이터의 정합성과 무결성을 위해 백오피스를 구축
데이터 관리
How to grade problem?
Prompt Tuning
Input Data를 모델의 특성에 맞춰 모델이 가장 잘 풀 수 있는 문제로 튜닝하는 방식
Few Shot Learning
데이터의 갯수가 0개부터 시작하는 프로젝트이므로 적은 데이터로 PLM을 적극 활용하는 Few Shot Learning 방식으로 접근
No Training Method
BERT의 Encoding 성능만 사용하여 전혀 학습을 하지 않고 유사도만을 이용해 비교하는 방식
Robust Result
키워드는 한글, 영어, 동음이의어 등등을
고려해야 한다.
4
How to grade problem?
키워드 채점 API
Input : Keywords, User Answer
Response : Correct Keywords
핵심 내용 포함 채점 API
Input : Key Contents, User Answer
Response : Correct Key Contents
5
How to grade problem?
키워드 채점 API
Input : Keywords, User Answer
Response : Correct Keywords
핵심 내용 포함 채점 API
Input : Key Contents, User Answer
Response : Correct Key Contents
6
How to grade problem?
키워드 채점 API
문제 : 쿠키와 세션의 차이점을 설명해주세요.
키워드 : 저장위치, 보안, Lifecycle, 속도
User Answer 1) 쿠키는 브라우저에 정보가 있기 때문에 서버에 요청 시 속도가 빠르고 세션은 정보가 서버에 저장되어있기 때문에 처리가 요구되어 비교적 느린 속도를 낸다. 세션은 …
Response : 속도, 보안
7
How to grade problem?
Keyword : 저장위치, 보안, Lifecycle, 속도
User Answer : …
Input
Keyword Sliding Window Validation
Preprocessing
Sentence-RoBerta
AI Model
저장위치, 속도
Result
8
How to grade problem?
Keyword : 저장위치, 보안, Lifecycle, 속도
User Answer : …
Input
Keyword Sliding Window Validation
Preprocessing
Sentence-RoBerta
AI Model
저장위치, 속도
Result
Sliding User Answer : [쿠키는 브라우저에 정보가, 브라우저에 정보가 있기, 정보가 있기 때문에, 있기 때문에 서버에, 때문에 서버에 요청 시, 서버에 요청 시 속도가 … ]
How to grade problem?
Keyword Sliding Window Validation?
User Answer : 쿠키는 브라우저에 정보가 있기 때문에 서버에 요청 시 속도가 빠르고 세션은 정보가 서버에 저장되어있기 때문에 처리가 요구되어 비교적 느린 속도를 낸다.
window size = 3
input with Keywords
키워드 모델
How to grade problem?
Keyword Sliding Window Validation?
키워드 모델
Result
11
How to grade problem?
핵심 내용 포함 채점 API
Input : Key Contents, User Answer
Response : Correct Key Contents
키워드 채점 API
Input : Keywords, User Answer
Response : Correct Keywords
12
How to grade problem?
핵심 내용 포함 채점 API
문제 : 쿠키와 세션의 차이점을 설명해주세요.
핵심 내용:
User Answer 1) 쿠키는 브라우저에 정보가 있기 때문에 서버에 요청 시 속도가 빠르고 세션은 정보가 서버에 저장되어있기 때문에 처리가 요구되어 비교적 느린 속도를 낸다. 세션은 …
Response : C, D
13
How to grade problem?
핵심내용: A, B, C, D
User Answer : …
Input
Prompt Tuning
Preprocessing
KE-T5-Base
AI Model
핵심내용 A, 핵심내용 B
Result
14
How to grade problem?
핵심내용: A, B, C, D
User Answer : …
Input
Prompt Tuning
Preprocessing
KE-T5-Base
AI Model
핵심내용 A, 핵심내용 B
Result
15
How to grade problem?
What is T5 Model ?
Text To Text Transfer Transformer
16
How to grade problem?
What is T5 Model ?
OR
<
Encoder Only Model like BERT
Decoder Only Model like GPT-3
17
How to grade problem?
핵심내용: A, B, C, D
User Answer : …
Input
Prompt Tuning
Preprocessing
KE-T5-Base
AI Model
핵심내용 A, 핵심내용 B
Result
18
How to grade problem?
What is Prompt tuning?
19
How to grade problem?
What is Prompt tuning?
20
How to grade problem?
Prompt Template
klue_nli premise: {premise} hypothesis: {hypothesis}
User Answer : 쿠키는 브라우저에 정보가 있기 때문에 서버에 요청 시 속도가 빠르고 세션은 정보가 서버에 저장되어있기 때문에 처리가 요구되어 비교적 느린 속도를 낸다.
NLI Task를 사용
Prompt
klue_nli premise: 쿠키는 브라우저에 정보가 있기 때문에 서버에 요청 시 속도가 빠르고 세션은 정보가 서버에 저장되어있기 때문에 처리가 요구되어 비교적 느린 속도를 낸다. hypothesis: 저장위치가 쿠키는 클라이언트측이고, 세션은 웹서버
Prompt Template
mlm : {user_answer}. 라는 문장에 {key_content} 라는 내용이 존재하는가? [MASK]
MLM Task 사용
Prompt
mlm: 쿠키는 브라우저에 정보가 있기 때문에 서버에 요청 시 속도가 빠르고 세션은 정보가 서버에 저장되어있기 때문에 처리가 요구되어 비교적 느린 속도를 낸다. 라는 문장에 저장위치가 쿠키는 클라이언트측이고, 세션은 웹서버라는 내용이 존재 하는가? [MASK]
entailment (관련 있다)
neutral (중립)
contradiction (관련 없다)
Yes
No
21
How to grade problem?
키워드 채점 API
Input : Keywords, User Answer
Response : Correct Keywords
핵심 내용 포함 채점 API
Input : Key Contents, User Answer
Response : Correct Key Contents
Scoring
Final Goal - 강약점 분석
네트워크
자료구조
DB
OS
50%
60%
70%
80%
23
Final Goal - 문제 추천