1 of 25

Автоматическое распознавание речи.

Языковые модели

П. А. Холявин

p.kholyavin@spbu.ru

05.03.2025

1

2 of 25

Задача распознавания речи

Если O = o1, o2, …, on – звуковая последовательность,

W = w1, w2, …, wn – последовательность слов, то

2

3 of 25

Языковые модели

Отвечают за P(W)

  1. Статистические

  • Формальные

3

4 of 25

Статистические ЯМ

P(wi) – униграммы

P(wi|wi-1) – биграммы

три-, тетра-, …

4

5 of 25

Вычисление N-грамм

<s> John read a book </s>

<s> I read a different book </s>

<s> John read a book by Mulan </s>

P(John read a book) =

5

6 of 25

Вычисление N-грамм

<s> John read a book </s>

<s> I read a different book </s>

<s> John read a book by Mulan </s>

P(John read a book) = P(John|<s>) * P(read|John) * P(a|read) * P(book|a) * P(</s>|book)

P(Mulan read a book) =

6

7 of 25

Вычисление N-грамм

<s> John read a book </s>

<s> I read a different book </s>

<s> John read a book by Mulan </s>

P(John read a book) = P(John|<s>) * P(read|John) * P(a|read) * P(book|a) * P(</s>|book)

P(Mulan read a book) = P(Mulan|<s>) * … = 0

7

8 of 25

Перплексия модели

(коэффициент неопределённости)

Вычисляется на тестовой последовательности длиной N. Чем ниже перплексия, тем лучше модель.

Перплексия связана с кросс-энтропией:

8

9 of 25

Сглаживание N-грамм

1. Сглаживание Лапласа (Laplace smoothing, add-1 smoothing)

9

10 of 25

Сглаживание N-грамм

<s> John read a book </s>

<s> I read a different book </s>

<s> John read a book by Mulan </s>

10

11 of 25

Сглаживание N-грамм

2. Плюс-k сглаживание

11

12 of 25

Сглаживание N-грамм

3. Откат и интерполяция

12

13 of 25

Сглаживание N-грамм

а) Откат Катца

13

14 of 25

б) Сглаживание Гуда-Тьюринга

где nr – количество n-грамм, встретившихся ровно r раз

Сглаживание N-грамм

14

15 of 25

в) Сглаживание Кнезера-Нея

Сглаживание N-грамм

15

16 of 25

г) “Глупый” откат (stupid backoff)

Сглаживание N-грамм

16

17 of 25

Классовые модели

Членами этих моделей являются не конкретные слова, а классы слов.

Классы могут быть:

  1. Построены вручную
  2. Частями речи
  3. Результатом автоматической кластеризации

17

18 of 25

Морфемные модели

Модель основа (s)/флексия (e):

18

19 of 25

Адаптивные модели

Интерполяция статической и локальной динамической (кэш) моделей

19

20 of 25

Адаптивные модели

TF-IDF модель

20

21 of 25

Сравнение моделей

21

22 of 25

Нейронные модели

22

23 of 25

Формальные модели

проехать

один

два

три

метра

направо

налево

вперёд

назад

метр

23

24 of 25

Формальные модели

24

25 of 25

Спасибо за внимание!

25