Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Кодирование звуковой информации






 

С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, может сохранять в виде файлов (файл - это определённое количество информации, хранящееся на диске и имеющее имя) и воспроизводить звуковую информацию. С помощью специальных программных средств (редакторов аудио файлов) открываются широкие возможности по созданию, редактированию и прослушиванию звуковых файлов. Создаются программы распознавания речи, и появляется возможность управления компьютером голосом.

Именно звуковая плата (карта) преобразует аналоговый сигнал в дискретную фонограмму и наоборот, «оцифрованный» звук – в аналоговый (непрерывный) сигнал, который поступает на вход динамика.

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче, чем больше частота, тем выше тон. Для того, чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).

В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. При этом звуковая волна разбивается на мелкие временные участки, для каждого из которых устанавливается значение амплитуды.

Временная дискретизация – процесс, при котором во время кодирования непрерывного звукового сигнала, звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды. Чем больше амплитуда сигнала, тем громче звук. Глубина звука (глубина кодирования) – количество бит на кодировку звука. Уровни громкости (уровни сигнала) – звук может иметь различные уровни громкости. Количество различных уровней громкости рассчитываем по формуле Хартли:

N= 2I, (3)

где I – глубина звука, N – уровни громкости.

Частота дискретизации – количество измерений уровня входного сигнала в единицу времени (за 1 с). Чем больше частота дискретизации, тем точнее процедура двоичного кодирования. Частота измеряется в герцах (Гц). 1 измерение за 1 секунду – 1 Гц, 1000 измерений за 1 с 1 кГц.

Обозначим частоту дискретизации буквой F. Для кодировки выбирают одну из трех частот: 44, 1 КГц, 22, 05 КГц, 11, 025 КГц.

Считается, что диапазон частот, которые слышит человек, составляет от 20 Гц до 20 кГц.

Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации.

Аудиоадаптер (звуковая плата) – устройство, преобразующее электрические колебания звуковой частоты в числовой двоичный код при вводе звука и обратно (из числового кода в электрические колебания) при воспроизведении звука.

Характеристики аудиоадаптера: частота дискретизации и разрядность регистра.

Разрядность регистра – число бит в регистре аудиоадаптера. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического тока в число и обратно. Если разрядность равна I, то при измерении входного сигнала может быть получено 2I = N различных значений.

Размер цифрового моноаудиофайла (A) измеряется по формуле:

A=F× T× I/8, (4)

где F – частота дискретизации (Гц), T – время звучания или записи звука, I ‑ разрядность регистра (разрешение).

По этой формуле размер измеряется в байтах.

Размер цифрового стереоаудиофайла (A) измеряется по формуле:

A=2× F× T× I/8, (5)

сигнал записан для двух колонок, так как раздельно кодируются левый и правый каналы звучания.

 

Пример 6. Необходимо оценить информационный объем моноаудиофайла длительностью звучания 1 с при высоком качестве звука (16 бит, 48 кГц).

Решение.

Количество битов нужно умножить на количество выборок в 1 секунду:

16 бит× 48 000=96 000 байт = 93, 75 Кб.

Ответ: объем информации моноаудиофайла длительностью звучания 1 секунда при высоком качестве звука (16 бит, 48 кГц) составляет 93, 75 Кб.

 

Пример 7. Определить размер (в байтах) цифрового аудиофайла, время звучания которого составляет 10 с при частоте дискретизации 22, 05 кГц и разрешении 16 бит.

Решение.

Формула для расчета размера (в байтах) цифрового аудио-файла: A=F× T× I/8. Для перевода в байты полученную величину надо разделить на 8 бит:

22, 05 кГц=22, 05× 1000 Гц =22050 Гц;

A=F× T× I/8=(22050× 10× 16)/8 =441000 байт.

Ответ: размер (в байтах) цифрового аудиофайла составляет 441000 байт.

 

Пример 8. Объем свободной памяти на диске – 5, 25 Мб, разрядность звуковой платы – 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 22, 05 кГц?

Решение.

Формула для расчета длительности звучания:

T=A/F/I;

(объем памяти в байтах)/(частота дискретизации в Гц)/(разрядность звуковой платы в байтах).

5, 25 Мбайт = 5505024 байт.

5505024 байт: 22050 Гц: 2 байта = 124, 8 с.

Ответ: 124, 8 с.

 

При стереофоническом звучании объём аудиофайла удваивается, при квадрофоническом звучании – учетверяется.

Пример 9. Вычислить, сколько байт информации занимает на компакт-диске одна секунда стереозаписи (частота 44032 Гц, 16 бит на значение). Сколько занимает одна минута? Какова максимальная емкость диска (считая максимальную длительность равной 80 мин)?

Решение.

Формула для расчета объема памяти A=F× T× I;

(время записи в секундах)× (разрядность звуковой платы
в байтах)× (частота дискретизации).

16 бит = 2 байта;

1) 1с × 2 × 44032 Гц = 88064 байт (1 с стереозаписи на компакт-диске);

2) 60с × 2 × 44032 Гц = 5283840 байт (1 минута стереозаписи на компакт-диске);

3) 4800с × 2 × 44032 Гц = 422707200 байт = 403, 125 Мбайт (80 мин);

Ответ: 88064 байт (1 секунда), 5283840 байт (1 минута), 403, 125 Мбайт (80 минут).

 

Пример 11. Подсчитать, сколько места будет занимать одна минута цифрового звука на жестком диске или любом другом цифровом носителе, записанного с частотой

а) 44, 1 кГц;

б) 11 кГц;

в) 22 кГц;

г) 32 кГц

и разрядностью 16 бит.

Решение.

а) Если записывают моносигнал с частотой 44, 1 кГц, разрядностью 16 бит (2 байта), то каждую минуту аналого-цифровой преобразователь будет выдавать 441000 × 2 × 60 = 529 000 байт (около 5 Мб) данных об амплитуде аналогового сигнала, который в компьютере записываются на жесткий диск.

Если записывают стереосигнал, то 1 058 000 байт (около 10 Мб).

Ответ: моносигнал – 529 000 байт, стереосигнал ‑ 1 058 000 байт.

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.