Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Стандарт сжатия движущихся изображений MPEG-2






В 1988 году для разработки методов сжатия и восстановления цифрового видеосигнала была организована специальная группа экспертов – Motion Pictures Expert Group (MPEG). Результатом исследований этой группы явилось создание международных стандартов для сжатия цифрового телевизионного сигнала, также получивших название MPEG. Специально для кодирования сигналов вещательного телевидения был разработан стандарт MPEG-2. Он позволяет получить высокую чёткость ТВ изображения, обеспечивая 576 активных строк в кадре и 720 отсчетов в активной части строки (горизонтальная четкость). Применение этого стандарта в вещательном телевидении позволяет значительно снизить объём передаваемых в единицу времени видео- и звуковых данных и за счёт этого передавать несколько цифровых программ в полосе частот одного стандартного радиоканала эфирного, кабельного или спутникового телевизионного вещания. Например, в системах спутникового телевизионного вещания сжатие ТВ-сигнала в стандарте MPEG-2 позволяет передавать по одному каналу до пяти цифровых программ, при профессиональном качестве видеосигнала.

Концепция сжатия видеосигналов в MPEG достаточно проста – определить, какая именно информация в потоке повторяется хотя бы в течение какого-то отрезка времени и принять меры к исключению дублирования этой информации. Наиболее ценное достоинство MPEG-кодирования, особенно удобное для передачи по различным сетям, – возможность гибкой настройки качества изображения в зависимости от пропускной способности сети. Это и сделало MPEG-2 фактическим стандартом для приёма/передачи цифрового телевидения по различным сетям.

Невозможно однозначно оценить качество кодирования какими-либо приборами и измерениями. Единственный критерий здесь – способность человека воспринимать сжатую информацию. Поэтому правила сжатия видеоданных при MPEG-кодировании вырабатывались на основе модели восприятия человеком видеоизображений (HVS - Human Visual Sense).

Избыточность изображения, согласно HVS, определяется по трём основным критериям: временная, пространственная и цветовая.

Устранение временной избыточности изображения, учитывающее тот факт, что в пределах коротких интервалов времени большинство фрагментов сцены оказываются неподвижными или незначительно смещаются по полю.
Устранение пространственной избыточности изображения путём подавления мелких деталей сцены, несущественных для визуального восприятия человеком.
Устранение цветовой избыточности изображения путём использование более низкого цветового разрешения при YRB-представлении изображений (Y — яркостный сигнал, R и B — цветоразностные сигналы). Опытным путём установлено, что глаз менее чувствителен к пространственным изменениям оттенков цвета по сравнению с изменениями яркости.

Техника сжатия кодированных изображений основывается на сокращении этих видов избыточности. Основная идея сжатия MPEG состоит в том, что из всего потока полностью передаются только избранные (опорные) кадры, для остальных же передаются их изменения по отношению к опорным. Действительно, в подвижном изображении от кадра к кадру в большинстве случаев меняется только его часть. Например, при выступлении диктора в «Новостях» меняется только его мимика. Полная же смена кадра происходит относительно редко, только когда очередной кадр нельзя восстановить как изменение предыдущего (в этом случае проще передать сам кадр).
По этой причине в MPEG определены три типа кадров:

I -кадры (Intra frames);
P -кадры (Predictive frames);
B- кадры (Bidirectional frames).

I- кадры несут полноценное неподвижное изображение и, кроме того, используются для построения P - и B -кадров. I -кадры играют роль опорных при восстановлении остальных изображений и размещаются последовательно через каждые 10-15 кадров. Только некоторые фрагменты изображений, которые находятся между I -кадрами, претерпевают изменения, и именно эта разница сохраняется при сжатии. P -кадры, то есть " предсказанные", строятся на базе последнего принятого I- или P- кадра. Если же предсказанный Р -кадр сильно отличается от предыдущего (например, произошла смена плана), то он кодируется как I -кадр.
Для удобства кодирования видеоданных весь видеопоток разбивается на группы изображений называемые GOP (Group of Pictures). Например, группа из 10 кадров строится так, как показано на рис. 10.12.

Все типы кадров группируются в последовательности. Таким образом, при частоте 25 кадров в секунду, новый I- кадр приходит максимум через

10х(1 / 25)=0, 4 секунды. Вместе с ним восстанавливается полная идентичность передаваемого и принимаемого изображения.

 

. Группы (GOP) видеопотока.

Рис.10.12. Группы (GOP) видеопотока

 

На этом рисунке показаны:

I – Intra-кадры, которые обычно называются «опорными» и содержат всю информацию об изображении. Без этих кадров MPEG- последовательности быть не может в принципе. При компрессии I- кадров происходит удаление только пространственной избыточности.

P – Predictive-кадры, " предсказанные" кадры, при формировании которых используется метод предсказания изображения на следующем кадре с учётом компенсации движения от последнего I - или P -кадра перед формируемым. P -кадр также служит для дальнейшего предсказания изображения. P -кадр создаётся с помощью межкадровой компрессии, уменьшающей как пространственную, так и временную избыточность. Изображение P -кадра вычитается из следующего изображения, эта разница кодируется и вместе с вектором движения добавляется к сжатым данным. Вектор движения представляет собой двумерный вектор, показывающий смещение координат восстанавливаемого объекта в текущем кадре, по сравнению с координатами объекта в предыдущем кадре.

B – Bi-directional-кадры, «двунаправленные» кадры. Они названы так потому, что хранят наиболее существенную информацию окружающих их I - и P -кадров. B -кадры имеют наивысшую степень компрессии, но требуют предыдущего и последующего изображения для компенсации движения объектов на изображении.

Такую структуру MPEG-потока обычно описывают в виде дроби M/N, для которой M сообщает общее число кадров в GOP, а N - каким по счету будет очередной P -кадр после предыдущего. Таким образом, GOP- последовательность, изображённая на рис.10.12, может быть записана как 10/3.

 






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.