1 of 23

© 2023. Saebyeol Yu. all rights reserved.

2 of 23

a table of contents

목차

1

스픽 소개

2

기술 분석

3

구독 후기

4

QnA

© 2023. Saebyeol Yu. all rights reserved.

3 of 23

도입 | Intro

© 2023. Saebyeol Yu. all rights reserved.

4 of 23

스픽 소개

영어 스피킹은 스픽(Speak)

Part 1

© 2023. Saebyeol Yu. all rights reserved.

5 of 23

#독해, 리스닝은 혼자할 수 있지만,

스피킹은 혼자할 수 없잖아요

© 2023. Saebyeol Yu. all rights reserved.

6 of 23

Part 1 |

스픽소개 - 왜 한국?

하버드 룸메이트, 한국 영어사업으로 의기투합하다

(좌) 스픽 한국지사장, 운영총괄 부사장 – 차승재

(우) 스픽 최고경영자(CEO) - 코너 니콜라이 즈윅

Connor : 미국 VC들 사이에선 “한국에서 살아남으면 어디서든 잘 된다.” 라는 말이 있을 정도로 한국 소비자들의 눈높이를 만족시키기 어려운 것이 오히려 한국 시장으로 진출 하게 된 계기가 되었다. 반대로 한국인들은 ‘스피킹’이라는 명확한 니즈가 보였습니다.

헤븐(?) 조선의 쓴맛을 보다

Connor : 한국만큼 학원이 발전한 나라도, 인터넷강의가 활성화된 나라도 없다. 한국인이 인정할 정도면 무조건 세계 시장에도 먹힐 것이다

한국인이 확신하는 앱이 되는 날, 글로벌 진출로

Connor : 한국 버전이 순항 중이지만, 현재 스픽은 한국 학습자에 특화되어 있다. 당장은 한국에 집중할 예정이다

© 2023. Saebyeol Yu. all rights reserved.

7 of 23

Part 1 |

스픽소개 – 스픽의 현재

© 2023. Saebyeol Yu. all rights reserved.

8 of 23

기술 분석

영어 스피킹은 스픽(Speak)

Part 2

© 2023. Saebyeol Yu. all rights reserved.

9 of 23

Part 2 |

기술분석 – 스픽의 기술 및 전략(OpenAI사의 버프)

Whisper

언어학 & 콘텐츠 전문가

GPT-4

OpenAI와 기술적 파트너십으로 최신 기술에 대한 얼리 엑세스 권한 보유

GPT-4 공식 발표 2개월 전부터 적용

스픽의 콘텐츠 팀은 TESOL과 SLA분야의 전문가들로 이루어져 있음

언어학 전문가와 콘텐츠 전문가의 협업

OpenAI사의 Whisper를 통한 음성인식 기술 사용

한국인 특화 음성 인식 모델 개발

© 2023. Saebyeol Yu. all rights reserved.

10 of 23

Part 2 |

기술분석 – OpenAI의 Whisper

Whisper는 2022년 9월 Open AI에서 개발한 자동음성인식(ASR: Automatic Speech Recognition) 모델

출처 : Robust Speech Recognition via Large-Scale Weak Supervision(2022),

Alec Radford, Jong Wook Kim, Tao Xu, Greg Brockman, Christine McLeavey, Ilya Sutskever

- Whisper는 Facebook AI에서 개발한 Wav2vec2.0 모델을 기반

- 네트워크 모델 자체는 Transformer를 사용해서 큰 차이가 없지만 Multitasking Training으로 Transcription 과 Translation Task가 존재함

- 다국어 인식 뿐만 아니라 바로 번역까지 가능

© 2023. Saebyeol Yu. all rights reserved.

11 of 23

Part 2 |

기술분석 – OpenAI의 Whisper

Whisper는 2022년 9월 Open AI에서 개발한 자동음성인식(ASR: Automatic Speech Recognition) 모델

- "Whisper’s English ASR performance is not perfect but very close to human-level accuracy.“

- WER(Word Error Rate) 기준으로 Whisper는 타사 음성인식 모델 보다 좋은 성능을 보이고 있음(A~D). 놀라운 점은 실제 사람보다 높은 수행능력을 보이기도 함(H, I)

- WER 기준으로 wav2vec2는 29.3%, whisper는 12.8%로 Whisper가 약 두배 이상 더 좋은 성능을 내고 있음

- 근 시일 내 알파고 처럼 사람을 뛰어넘는 ‘인식’엔진이 나올 것으로 생각됨

출처 : Robust Speech Recognition via Large-Scale Weak Supervision(2022), Alec Radford, Jong Wook Kim, Tao Xu, Greg Brockman, Christine McLeavey, Ilya Sutskever

© 2023. Saebyeol Yu. all rights reserved.

12 of 23

Part 2 |

기술분석 – 프롬프트 엔지니어링

빠르고 정확한 자체 개발 음성 인식 모델

스픽의 음성 인식(Automatic Speech Recognition) 모델은 원어민의 영어 음성 데이터와,

100만 명 이상 한국인의 영어 음성 데이터를 조합하여 학습된 최적의 결과물입니다.

한국인의 영어 발음을 정확히 인식하는 스픽의 음성인식 모델은 0.1 초 이내의 빠른 인식 속도와

95% 이상의 높은 정확도로 제품 내 핵심 기능들을 구현합니다.

© 2023. Saebyeol Yu. all rights reserved.

13 of 23

음소 단위 분석과 실시간 피드백

스픽의 음소 인식(Phoneme Recognition) 기술은 사용자의 음성을 즉시 발음 기호로 변환하여

음소 단위의 음성 분석을 할 수 있도록 학습되었습니다.

인식된 사용자의 발음 기호와 모범 발음 기호는 실시간으로 대조 분석되어

사용자에게 정확한 피드백을 전달합니다.

Part 2 |

기술분석 – 프롬프트 엔지니어링

© 2023. Saebyeol Yu. all rights reserved.

14 of 23

구독 후기

영어 스피킹은 스픽(Speak)

Part 3

© 2023. Saebyeol Yu. all rights reserved.

15 of 23

#다양한 콘텐츠

Part 3 |

구독후기 - 장단점 분석

16 of 23

#피드백

Part 3 |

구독후기 - 장단점 분석

© 2023. Saebyeol Yu. all rights reserved.

17 of 23

#인식률

Part 3 |

구독후기 - 장단점 분석

에어팟으로는 인식이 안돼..

가끔.. 소리를 질러야해..

© 2023. Saebyeol Yu. all rights reserved.

18 of 23

Part 3 |

구독후기 – 오직 미국 원어민 발음만?

스픽의 수업에서 제공하는 수업 발음/표현은 미국식 발음

© 2023. Saebyeol Yu. all rights reserved.

19 of 23

Part 3 |

구독후기 – 오직 미국 원어민 발음만?

영국식, 호주식 발음도 모두 인식한다!

© 2023. Saebyeol Yu. all rights reserved.

20 of 23

Part 3 |

구독후기 – 고진감래

Sweet After Bitter

고진감래

© 2023. Saebyeol Yu. all rights reserved.

21 of 23

Part 3 |

구독후기 – 고진감래

© 2023. Saebyeol Yu. all rights reserved.

22 of 23

“개선이 필요한 부분은 있지만, 스픽은 계속 진화하고 있다.”

“지겨울 정도로 영어를 하게 만든다.”

© 2023. Saebyeol Yu. all rights reserved.

23 of 23

Q&A

© 2023. Saebyeol Yu. all rights reserved.