Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Оцифровка и форматы хранения звуковых данных






Звук — это колебания (волны), распространяющиеся в воздухе или другой среде от источника колебаний во всех направлениях. Когда волны достигают человеческого уха, расположенные в нем чувствительные элементы воспринимают эту вибрацию и человек слышит звук. Каждый звук характеризуется частотой и интенсивностью (громкостью).

Частота — это количество звуковых колебаний в секунду; она измеряется в герцах (Гц). Человеческое ухо воспринимает лишь небольшой диапазон частот. Очень немногие слышат звуки ниже 16 Гц и выше 20 кГц (1 кГц = 1 000 Гц). Частота звука самой низкой ноты на рояле равна 27 Гц, а самой высокой — чуть больше 4 кГц. Наивысшая звуковая частота, которую могут передать радиовещательные FM-станции, — 15 кГц.

Громкость звука определяется амплитудой колебаний. Амплитуда звуковых колебаний зависит в первую очередь от мощности источника звука. Например, струна пианино при слабом ударе по клавише звучит тихо, поскольку диапазон ее колебаний невелик. Если же ударить по клавише посильнее, то амплитуда колебаний струны увеличится. Громкость звука измеряется в децибелах (дБ). Шорох листьев, например, имеет громкость около 20 дБ, обычный уличный шум — около 70 дБ, а близкий удар грома — 120 дБ.

К сказанному следует добавить, что в реальных условиях мы воспринимаем смесь (наложение звуков от разных источников). Также следует подчеркнуть, что звук имеет аналоговую природу. Для сохранения и воспроизведении звука на компьютере используется он преобразуется в цифровую форму.

Процесс превращения исходного звукового сигнала в цифровую форму называется дискретизацией (или оцифровыванием). При этом сохраняются мгновенные значения звукового сигнала в определенные моменты времени, называемые выборками. Чем чаще берутся выборки, тем точнее цифровая копия звука соответствует оригиналу. Теоретически частота выборки (дискретизации) должна быть в два раза выше максимальной частоты сигнала (т.е. верхней границы частот) плюс некоторый запас. Предел слышимости человеческого уха — 20 кГц, соответственно, записи для аудио компакт-дисков делаются с частотой дискретизации 44, 1 кГц.

Разрядность звука характеризует количество бит, используемых для цифрового представления каждой выборки. При восьми разрядах количество дискретных уровней амплитуды звукового сигнала составляет 256, а если использовать 16 бит, то их количество достигает 65 536 (при этом, естественно, качество звука значительно улучшается).

Для записи и воспроизведения речи достаточно 8-разрядного представления, а вот для музыки требуется 16 разрядов и более.

Объем дискового пространства, необходимый для записи 16-разрядного звука с частотой дискретизации 44, 1 кГц в течение одной минуты, составит 10, 5 Мб. При 8-разрядном представлении, монофоническом звучании и частоте дискретизации 11 кГц необходимое дисковое пространство сокращается в 16 раз.

Для хранения аудиозаписей на персональном компьютере используются файлы двух основных типов.

В файлах первого типа, называемых обычными звуковыми файлами, используются форматы.wav,.voc,.au и.aiff. Звуковой файл содержит данные о форме волны, т.е. такой файл представляет собой запись аналоговых аудиосигналов в цифровой форме в соответствии с описанным подходом.

Стандартом хранения звука в Windows является формат.wav, эти файлы создаются штатными средствами и используются в других приложениях.

С целью уменьшения объема и дальнейшего использования в Internet звуковые файлы могут быть сжаты. Для сжатых файлов создано несколько стандартов mp3, wma, перспективные AAC (advanced audio codec), VQF, PAC (perceptual audio codec).

Самый популярный на сегодняшний день формат звуковых файлов —.mp3. Качество этих файлов приближается к качеству компакт-диска, по размеру они намного меньше обычных файлов.wav. Этот формат и используемый в нем метод сжатия был разработан немецкой фирмой Fraunhofer IIS. Европейская корпорация THOMSON активно поддержала новоявленный формат и приложила все усилия к его быстрейшему распространению. Именно при ее поддержке формат стал одним из стандартов аудиосжатия и получил название MPEG Layer3 или более привычное MP3.

MP3 является потоковым форматом. Звуковая информация при кодировании разбивается на равные по продолжительности участки, которые называются фреймами. Все фреймы взаимно независимы. Каждый из этих фреймов кодируется отдельно со своими параметрами и имеет заголовок, в котором эти параметры описаны. Воспроизведение последовательности декодированных фреймов и порождает непрерывное звучание записанного звука.

Какие преимущества дает данный подход? Во-первых, возможность перемотки, так как возможен легкий переход к произвольному фрейму, и воспроизведение звука именно с этого места. Во-вторых, именно эта структурная особенность и делает MP3 по настоящему сетевым форматом. Загрузив первые несколько фреймов в оперативную память или дисковый кэш, проигрыватель начинает их воспроизводить, при этом одновременно подгружая новые фреймы, чем достигается непрерывность воспроизведения. И наконец, если не удалось целиком скачать MP3 файл из сети Internet, то ничего страшного, музыку все равно можно будет слушать, просто проигрыватель дойдет до того места, на котором оборвалась связь и остановится.

Само сжатие производится внутри фрейма с потерями за счет отбрасывания части высоких частот и малых амплитуд. Что именно и в каком количестве отбрасывать зависит от " ширины потока" (bitrate) – количества бит за секунду, отводимых на кодирование. Этим параметром можно регулировать качество звука. Алгоритм сжатия очень эффективен:

320kbs - коэффициент сжатия 4: 1 (качество на уровне CD audio)

256 kbs - 6: 1 (размер несколько меньше, качество смело можно считать близким к оригиналу)

128 kbs - 12: 1 (при этом 1 минута звучания занимает примерно 1 мегабайт и обеспечивает качество на уровне средней аудиокассеты).

Второй тип аудиофайла — файл MIDI. Файлы MIDI имеют расширение.mid или.rmi и являются полностью цифровыми, содержащими не запись звука, а команды, используемые аудиооборудованием для его создания. MIDI — мощный язык программирования, который получил распространение в 80-е годы и был разработан специально для электронных музыкальных инструментов. Стандарт MIDI стал новым словом в области электронной музыки. С помощью MIDI можно создавать, записывать, редактировать и воспроизводить музыкальные файлы на персональном компьютере или на MIDI-совместимом электронном музыкальном инструменте, подключенном к компьютеру.

Файлы MIDI, в отличие от других типов звуковых файлов, требуют относительно небольшого объема дискового пространства. Для записи часа стереомузыки, хранимой в формате MIDI, требуется менее 500 Кбайт. Во многих играх используется запись звуков в формате MIDI.

Файлы MIDI не предназначены для замены звуковых файлов типа.wav. Самый большой недостаток этой технологии — возможность воспроизводить только те звуки, которые предусмотрены в синтезаторе. Например, нельзя создать голоса, речь.

Поскольку файл MIDI состоит из цифровых команд, его редактировать намного легче, чем звуковой файл типа.wav. Соответствующее программное обеспечение позволяет выбирать любой канал MIDI, записывать ноты, а также добавлять различные эффекты. Когда файл MIDI запускается на персональном компьютере, то компьютер фактически создает музыку по записанным командам.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.