1 of 18

Обработка и интерпретация речевого сигнала. Введение

П. А. Холявин

p.kholyavin@spbu.ru

05.09.2024

1

2 of 18

Аналого-цифровое преобразование

период дискретизации T

Fдискр = 1 / T

отсчёт

уровни квантования

2

3 of 18

Теорема Котельникова

Любой сигнал s(t), спектр которого не содержит составляющих с частотами выше некоторого значения f, может быть без потерь представлен в виде дискретного сигнала с частотой дискретизации F >= 2f (частота Найквиста).

3

4 of 18

Типы квантования

С нулевой степенью

С ненулевой степенью

4

5 of 18

Шум квантования

5

6 of 18

Кодирование речевого сигнала

1. Ограничение в частотной области:

Телефонная речь – 300-3400 Гц, ЧД = 8 кГц

Wideband speech – 50-7000 Гц, ЧД = 16 Кгц

HF-аудио – ЧД = 44.1 кГц

6

7 of 18

Цифровые аудиоформаты

  1. Без сжатия (WAV, AIFF, RAW)

  • Сжатие без потерь (FLAC, M4A, WMA Lossless)

  • Сжатие с потерями (MP3, AAC, WMA)

7

8 of 18

Формат .WAV

8

9 of 18

Формат .WAV

Типичные ЧД WAV:

11 025, 22 050, 44 100

8 000, 16 000, 32 000

Типичные значения количества бит на отсчёт WAV: 8, 16, 24, 48

9

10 of 18

Linear Pulse Code Modulation (PCM)

1. Входной сигнал ограничен

2. Шаг квантизации постоянен (равномерное квантование)

B – количество бит, тогда N = 2B – количество уровней квантования

Δ – шаг квантования

10

11 of 18

Linear Pulse Code Modulation (PCM)

3. Шум квантования:

а) является белым

б) не коррелирует с сигналом

в) равномерно распределён в интервале ( -Δ / 2, Δ / 2)

11

12 of 18

μ-law и A-law PCM

μ = 255

A = 87.56

12

13 of 18

Адаптивный PCM

Шаг квантования пропорционален стандартному отклонению сигнала:

Оно меняется медленно, поэтому шаг не нужно передавать с каждым отсчётом.

13

14 of 18

Дифференциальная квантизация (DPCM)

Квантуемая величина – разница между отсчётом и его предсказанным значением:

14

15 of 18

Дельта-модуляция

15

16 of 18

Адаптивная дельта-модуляция

16

17 of 18

Стандарты кодирования

17

18 of 18

Спасибо за внимание!

18