© 2023. Saebyeol Yu. all rights reserved.
a table of contents
목차
1
스픽 소개
2
기술 분석
3
구독 후기
4
QnA
© 2023. Saebyeol Yu. all rights reserved.
도입 | Intro
© 2023. Saebyeol Yu. all rights reserved.
스픽 소개
영어 스피킹은 스픽(Speak)
Part 1
© 2023. Saebyeol Yu. all rights reserved.
#독해, 리스닝은 혼자할 수 있지만,
스피킹은 혼자할 수 없잖아요
© 2023. Saebyeol Yu. all rights reserved.
Part 1 |
스픽소개 - 왜 한국?
하버드 룸메이트, 한국 영어사업으로 의기투합하다
(좌) 스픽 한국지사장, 운영총괄 부사장 – 차승재
(우) 스픽 최고경영자(CEO) - 코너 니콜라이 즈윅
Connor : 미국 VC들 사이에선 “한국에서 살아남으면 어디서든 잘 된다.” 라는 말이 있을 정도로 한국 소비자들의 눈높이를 만족시키기 어려운 것이 오히려 한국 시장으로 진출 하게 된 계기가 되었다. 반대로 한국인들은 ‘스피킹’이라는 명확한 니즈가 보였습니다.
헤븐(?) 조선의 쓴맛을 보다
Connor : 한국만큼 학원이 발전한 나라도, 인터넷강의가 활성화된 나라도 없다. 한국인이 인정할 정도면 무조건 세계 시장에도 먹힐 것이다
한국인이 확신하는 앱이 되는 날, 글로벌 진출로
Connor : 한국 버전이 순항 중이지만, 현재 스픽은 한국 학습자에 특화되어 있다. 당장은 한국에 집중할 예정이다
© 2023. Saebyeol Yu. all rights reserved.
Part 1 |
스픽소개 – 스픽의 현재
© 2023. Saebyeol Yu. all rights reserved.
기술 분석
영어 스피킹은 스픽(Speak)
Part 2
© 2023. Saebyeol Yu. all rights reserved.
Part 2 |
기술분석 – 스픽의 기술 및 전략(OpenAI사의 버프)
Whisper
언어학 & 콘텐츠 전문가
GPT-4
OpenAI와 기술적 파트너십으로 최신 기술에 대한 얼리 엑세스 권한 보유
GPT-4 공식 발표 2개월 전부터 적용
스픽의 콘텐츠 팀은 TESOL과 SLA분야의 전문가들로 이루어져 있음
언어학 전문가와 콘텐츠 전문가의 협업
OpenAI사의 Whisper를 통한 음성인식 기술 사용
한국인 특화 음성 인식 모델 개발
© 2023. Saebyeol Yu. all rights reserved.
Part 2 |
기술분석 – OpenAI의 Whisper
Whisper는 2022년 9월 Open AI에서 개발한 자동음성인식(ASR: Automatic Speech Recognition) 모델
출처 : Robust Speech Recognition via Large-Scale Weak Supervision(2022),
Alec Radford, Jong Wook Kim, Tao Xu, Greg Brockman, Christine McLeavey, Ilya Sutskever
- Whisper는 Facebook AI에서 개발한 Wav2vec2.0 모델을 기반
- 네트워크 모델 자체는 Transformer를 사용해서 큰 차이가 없지만 Multitasking Training으로 Transcription 과 Translation Task가 존재함
- 다국어 인식 뿐만 아니라 바로 번역까지 가능
© 2023. Saebyeol Yu. all rights reserved.
Part 2 |
기술분석 – OpenAI의 Whisper
Whisper는 2022년 9월 Open AI에서 개발한 자동음성인식(ASR: Automatic Speech Recognition) 모델
- "Whisper’s English ASR performance is not perfect but very close to human-level accuracy.“
- WER(Word Error Rate) 기준으로 Whisper는 타사 음성인식 모델 보다 좋은 성능을 보이고 있음(A~D). 놀라운 점은 실제 사람보다 높은 수행능력을 보이기도 함(H, I)
- WER 기준으로 wav2vec2는 29.3%, whisper는 12.8%로 Whisper가 약 두배 이상 더 좋은 성능을 내고 있음
- 근 시일 내 알파고 처럼 사람을 뛰어넘는 ‘인식’엔진이 나올 것으로 생각됨
출처 : Robust Speech Recognition via Large-Scale Weak Supervision(2022), Alec Radford, Jong Wook Kim, Tao Xu, Greg Brockman, Christine McLeavey, Ilya Sutskever
© 2023. Saebyeol Yu. all rights reserved.
Part 2 |
기술분석 – 프롬프트 엔지니어링
빠르고 정확한 자체 개발 음성 인식 모델
스픽의 음성 인식(Automatic Speech Recognition) 모델은 원어민의 영어 음성 데이터와,
100만 명 이상 한국인의 영어 음성 데이터를 조합하여 학습된 최적의 결과물입니다.
한국인의 영어 발음을 정확히 인식하는 스픽의 음성인식 모델은 0.1 초 이내의 빠른 인식 속도와
95% 이상의 높은 정확도로 제품 내 핵심 기능들을 구현합니다.
© 2023. Saebyeol Yu. all rights reserved.
음소 단위 분석과 실시간 피드백
스픽의 음소 인식(Phoneme Recognition) 기술은 사용자의 음성을 즉시 발음 기호로 변환하여
음소 단위의 음성 분석을 할 수 있도록 학습되었습니다.
인식된 사용자의 발음 기호와 모범 발음 기호는 실시간으로 대조 분석되어
사용자에게 정확한 피드백을 전달합니다.
Part 2 |
기술분석 – 프롬프트 엔지니어링
© 2023. Saebyeol Yu. all rights reserved.
구독 후기
영어 스피킹은 스픽(Speak)
Part 3
© 2023. Saebyeol Yu. all rights reserved.
#다양한 콘텐츠
Part 3 |
구독후기 - 장단점 분석
#피드백
Part 3 |
구독후기 - 장단점 분석
© 2023. Saebyeol Yu. all rights reserved.
#인식률
Part 3 |
구독후기 - 장단점 분석
에어팟으로는 인식이 안돼..
가끔.. 소리를 질러야해..
© 2023. Saebyeol Yu. all rights reserved.
Part 3 |
구독후기 – 오직 미국 원어민 발음만?
스픽의 수업에서 제공하는 수업 발음/표현은 미국식 발음
© 2023. Saebyeol Yu. all rights reserved.
Part 3 |
구독후기 – 오직 미국 원어민 발음만?
영국식, 호주식 발음도 모두 인식한다!
© 2023. Saebyeol Yu. all rights reserved.
Part 3 |
구독후기 – 고진감래
Sweet After Bitter
고진감래
© 2023. Saebyeol Yu. all rights reserved.
Part 3 |
구독후기 – 고진감래
© 2023. Saebyeol Yu. all rights reserved.
“개선이 필요한 부분은 있지만, 스픽은 계속 진화하고 있다.”
“지겨울 정도로 영어를 하게 만든다.”
© 2023. Saebyeol Yu. all rights reserved.
Q&A
© 2023. Saebyeol Yu. all rights reserved.