1 of 18

Автоматическое распознавание речи. Введение

П. А. Холявин

p.kholyavin@spbu.ru

12.02.2025

1

2 of 18

«Распознавание» одного слова

1922

2

3 of 18

Распознавание отдельных слов

AUDREY, 1952

(Bell Laboratories)

3

4 of 18

Распознавание отдельных слов

IBM Shoebox, 1966

4

5 of 18

Whither speech recognition?

John R. Pierce, 1969 (Bell Labs)

5

6 of 18

Распознавание слитной речи

Carnegie-Mellon’s HARPY (1976)

-//- Hearsay-I (1976)

6

7 of 18

Распознавание слитной речи

1990-е:

- Доступ потребителей к системам распознавания речи

Dragon Dictate (1990)

IBM MedSpeak (1996)

- Работа над машинным пониманием речи

2010-е:

- Нейронные сети/глубокое обучение

7

8 of 18

Задача распознавания речи

Задача АРР – сопоставить акустическому сигналу последовательность слов.

Более формально: каково наиболее вероятное предложение из всех возможных в языке L при условии акустического сигнала O?

Если O = o1, o2, …, on – звуковая последовательность,

W = w1, w2, …, wn – последовательность слов, то

8

9 of 18

Вариативность задачи

  1. Количество слов в словаре:

малый — единицы/десятки

средний — сотни

большой — тысячи/десятки тысяч

сверхбольшой — сотни тысяч/миллионы

  • Дикторозависимость

  • Изолированные слова / слитная речь

  • Качество канала

  • Физиологические и лингвистические особенности

9

10 of 18

Части системы АРР

10

11 of 18

Оценка работы АРР

Word Error Rate

WER = 100 %

(Sentence Error Rate, Morpheme Error Rate, Phone Error Rate)

RTF (Real Time Factor)

11

12 of 18

Аналого-цифровое преобразование

период дискретизации T

Fдискр = 1 / T

отсчёт

уровни квантования

12

13 of 18

Теорема Котельникова

Любой сигнал s(t), спектр которого не содержит составляющих с частотами выше некоторого значения f, может быть без потерь представлен в виде дискретного сигнала с частотой дискретизации F >= 2f (частота Найквиста).

13

14 of 18

Частотный анализ сигнала

  1. Дискретное преобразование Фурье (частотный спектр дискретного сигнала)

from scipy.fft import fft

14

15 of 18

Оконный метод

  1. Параметры: длина окна и шаг окна

15

16 of 18

Оконные функции

17 of 18

Спектрографический анализ

17

18 of 18

Спасибо за внимание!

18