Обработка и интерпретация речевого сигнала. Введение
П. А. Холявин
p.kholyavin@spbu.ru
05.09.2024
1
Аналого-цифровое преобразование
период дискретизации T
Fдискр = 1 / T
отсчёт
уровни квантования
2
Теорема Котельникова
Любой сигнал s(t), спектр которого не содержит составляющих с частотами выше некоторого значения f, может быть без потерь представлен в виде дискретного сигнала с частотой дискретизации F >= 2f (частота Найквиста).
3
Типы квантования
С нулевой степенью
С ненулевой степенью
4
Шум квантования
5
Кодирование речевого сигнала
1. Ограничение в частотной области:
Телефонная речь – 300-3400 Гц, ЧД = 8 кГц
Wideband speech – 50-7000 Гц, ЧД = 16 Кгц
HF-аудио – ЧД = 44.1 кГц
6
Цифровые аудиоформаты
7
Формат .WAV
8
Формат .WAV
Типичные ЧД WAV:
11 025, 22 050, 44 100
8 000, 16 000, 32 000
Типичные значения количества бит на отсчёт WAV: 8, 16, 24, 48
9
Linear Pulse Code Modulation (PCM)
1. Входной сигнал ограничен
2. Шаг квантизации постоянен (равномерное квантование)
B – количество бит, тогда N = 2B – количество уровней квантования
Δ – шаг квантования
10
Linear Pulse Code Modulation (PCM)
3. Шум квантования:
а) является белым
б) не коррелирует с сигналом
в) равномерно распределён в интервале ( -Δ / 2, Δ / 2)
11
μ-law и A-law PCM
μ = 255
A = 87.56
12
Адаптивный PCM
Шаг квантования пропорционален стандартному отклонению сигнала:
Оно меняется медленно, поэтому шаг не нужно передавать с каждым отсчётом.
13
Дифференциальная квантизация (DPCM)
Квантуемая величина – разница между отсчётом и его предсказанным значением:
14
Дельта-модуляция
15
Адаптивная дельта-модуляция
16
Стандарты кодирования
17
Спасибо за внимание!
18