Распознавание речи.
Произносительные словари
П. А. Холявин
p.kholyavin@spbu.ru
13.03.2024
1
Произносительные словари
2
Представление лексикона как дерева
Допустим, у нас есть слова ban, band, banned, bat, beef. Как будет выглядеть дерево?
3
Методы создания словарей
1. Экспертный
2. Автоматический (grapheme-to-phoneme, G2P)
а) по правилам
б) с помощью машинного обучения
в) с помощью систем распознавания речи
3. Гибридный (?)
4
Автоматическая транскрипция
G2P (Grapheme-to-Phoneme)
+ проблема вариативности: какой вариант выбрать для системы?
5
Вариативность
6
Фонемная транскрипция
1) По словарю
7
Фонемная транскрипция
2) По правилам
Правила могут кодироваться в конечных автоматах, …
8
Фонемная транскрипция
3) Статистические методы и машинное обучение:
9
Стыки слов
Кот бежит /kod bʲiʒɨt/
Отец дома /atʲe[dz] dóma/
Раз в жизни /raʒ (v) ʒɨzʲnʲi/
10
Фонетическая транскрипция
Типы произнесения: полный и неполный (невозможно восстановить фонемный состав)
[ɡəvɐˈrʲit]
[ɡəˈrʲit]
[ɡrʲit]
3. Влияние других просодических явлений
11
Взвешенные конечные преобразователи (WFST)
12
Phonetisaurus
13
Phonetisaurus
14
Phonetisaurus
15
Phonetisaurus
16
Phonetisaurus
17
Другие методы
18
Listen, Attend and Spell
19
Генерация транскрипций с помощью ASR
20
Генерация транскрипций с помощью ASR
21
Динамические словари
22
Оценка качества транскрипций
23
Спасибо за внимание!
24