Кодирование звуковой
информации.
Звуковой волной (звуком) - принято называть упругие волны, распространяющиеся в какой-либо упругой среде и создающие в ней механические колебания.
Характеристики звука:
Частота звука – это физическая величина численно равная отношению числа полных колебаний ко времени, за которое эти колебания были совершены.
Чем больше частота колебаний, тем выше тон звука.
Частота звука измеряется в герцах (Гц, Hz).
Низкая частота Высокая частота
Амплитуда (громкость, сила звука, звуковое давление) – это сила колебаний или уровень звукового давления.
Чем больше амплитуда звуковой волны, тем громче звук.
Амплитуда измеряется в децибелах (дБ, dB)
Низкий звук Высокий звук
Частота звука, слышимого человеком, лежит в пределах от 16 Гц до16 - 20 кГц. Упругие волны с частотой ниже слышимого диапазона называют инфразвуком (в т. ч. сотрясение),
с более высокой частотой – ультразвуком, а самые высокочастотные упругие волны –гиперзвуком.
Некоторые значения уровней звука
Едва слышимый звук (порог слышимости) | 0 дБ |
Шелест листьев при слабом ветре | 10-20 дБ |
Обычный шепот (около уха) | 20-30 дБ |
Шумовой фон в городе ночью | 40 дБ |
Речь средней громкости | 50-60 дБ |
Шум пишущей машинки | 70 дБ |
Автомагистраль с интенсивным движением | 80-90 дБ |
Авиадвигатели | 110-120 дБ |
Болевой порог | 130-140 дБ |
Аналоговый
принимает бесконечное множество значений из некоторого диапазона
Дискретный
принимает конечное число значений
ЗВУК
Для того чтобы компьютер мог обрабатывать звук, аналоговый звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации.
Непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости.
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
0 | 0 | 0 | 0 | 0 | 1 | 1 | 1 |
0 | 1 | 1 | 0 | 0 | 1 | 1 | 1 |
0 | 1 | 1 | 0 | 0 | 1 | 1 | 1 |
1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
A
t
Временная дискретизация
Процесс получения цифровой формы звука называется оцифровкой.
Устройство, выполняющее оцифровку звука называется АЦП - аналого-цифровой преобразователь (ACD);
Устройство, выполняющее обратное преобразование – ЦАП – цифро-аналоговый преобразователь (DAC);
Оцифровка звука
Состав:
Звуковая плата
Двоичное кодирование
звуковой информации
Схема записи звука:
Схема воспроизведения звука:
звуковая волна 🡪 микрофон 🡪 переменный электрический ток 🡪 аудиоадаптер (звуковая карта) 🡪 двоичный код 🡪 память ПК
память ПК 🡪 двоичный код 🡪 аудиоадаптер (звуковая карта) 🡪 переменный электрический ток 🡪 динамик 🡪 звуковая волна
Частота дискретизации звука - это количество измерений уровней громкости звука за одну секунду.
Характеристики цифрового звука:
Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду (измеряется в Гц).
Глубина кодирования звука - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.
Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитывать по общей формуле N = 2I. ��Например, пусть глубина кодирования звука составляет 16 битов, в таком случае количество уровней громкости звука равно: ��N = 2I = 216 = 65 536. ��В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему - 1111111111111111.
Качество оцифрованного звука
Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим "моно"). ��Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим "стерео"). ��Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.
Режимы
воспроизведения
моно-, стерео-, квадро-
Моно- и стерео режим воспроизведения:
V=M*i*t*k
V – объем звукового файла;
M– частота дискретизации (Гц);
i – глубина кодирования (разрядность звуковой карты);
k – количество каналов (1 – моно, 2 – стерео, 4-квадро);
t – время звучания (сек.)
Увеличивая частоту дискретизации и глубину кодирования, можно более точно сохранить (и впоследствии восстановить) форму звукового сигнала, но при этом увеличивается объем сохраненных данных.
Размер звукового файла
Форматы звуковых файлов:
MIDI - запись музыкальных произведений в виде команд синтезатору, компактны, голос человека не воспроизводят, (соответствуют векторному представлению в графике).
WAV – универсальный звуковой формат, в нем хранится полная информация об оцифрованном звуке (соответствует формату bmp в графике). Занимает очень большой объем памяти (15 Мбайт на 1 минуту звучания).
MP3 – формат сжатия аудиоинформации с регулируемой потерей информации, позволяет сжимать файлы в несколько раз в зависимости от заданного битрейта (в среднем в 11 раз). �Даже при самом высоком битрейте – 320 кбит/сек – обеспечивает 4-кратное сжатие по сравнению с компакт-дисками.
APE – формат сжатия аудиоинформации без потери информации (а следовательно – качества) , коэффициент сжатия около 2.
Пример 1:
Можно легко оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду и умножить на 2 канала (стереозвук): ��16 бит × 24 000 × 2 = 768 000 бит = 96 000 байт = 93,75 Кбайт.
Задание 1:
Какой объем будет иметь звуковой моно аудиофайл, если длительность звука 1 минута, глубина кодирования 8 бит, а частота дискретизации 22050Гц?
Задание 2:
Определить объем памяти для хранения цифрового моно аудиофайла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 битов.
Задание 3:
Вычислите сколько байтов занимает на CD одна минута стереозаписи (частота дискретизации 44000 герц, разрядность 16 бит). Какова максимальная продолжительность стереозаписи на диске ёмкостью 700 Мбайт?
Задание 4:
Производилась одноканальная звукозапись с частотой дискретизации 16 кГц и 32-битным разрешением. Был получен файл размером 20 Мб. Какая из приведенных ниже величин наиболее близка ко времени, в течении которого производилась запись?
Задание 5:
Производится одноканальная (моно) звукозапись с частотой дискретизации 16 кГц и глубиной кодирования 24 бита. Запись длится 1 минуту, ее результаты записывают в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в Мб?