Устранение ошибочно найденных векторов движения при кодировании видеоинформации в стандарте MPEG-4 | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 28 декабря, печатный экземпляр отправим 1 января.

Опубликовать статью в журнале

Библиографическое описание:

Дедушкин, А. В. Устранение ошибочно найденных векторов движения при кодировании видеоинформации в стандарте MPEG-4 / А. В. Дедушкин, А. В. Курангышев, А. В. Казначеев. — Текст : непосредственный // Молодой ученый. — 2016. — № 2 (106). — С. 135-140. — URL: https://moluch.ru/archive/106/25282/ (дата обращения: 19.12.2024).



 

Presented the coding standard MPEG-4 video.Examined The principle of operation of motion compensation, given the major disadvantages of the using algorithms of appearance macroblock motion vector and offered the method of eliminating these drawbacks.

Key words:MPEG-4 standard, interframe compression, encoding in the MPEG-4, MPEG-4 encoder, frame compression.

 

Появление цифрового способа съемки видео началось с 80-х годов. Видеоинформация тогда была несжатая, чистая, требовавшая носителей информации огромных объемов и ресурсов воспроизводящих систем для проигрывания и хранения данных. Сегодня мы почти уже не имеем проблем, связанных с нехваткой объема хранимой информации на носителях, поскольку нынче существуют различные способы кодирования видеоинформации. Но все это еще не говорит, что любое кодированное видео может быть восстановлено декодерами с высокой точностью.

В процессе кодирования видеосигнала, поток видеоинформации непрерывно анализируется специальными программными средствами, и ненужные фрагменты данных попросту отсекаются, что помогает значительно уменьшить объем видеофайла.

Существует два вида сжатия видеоинформации: покадровое (внутрикадровое) и межкадровое (межполевое) кодирование.

Покадровое сжатие обрабатывает каждый кадр видеозаписи как отдельное неподвижное изображение, на подобии фотографии в jpeg-формате. Данная технология отличается хорошим качеством видео, однако уменьшение размера видеофайла незначительное из-за того, что сохраняются все кадры, даже если не происходит изменений в изображении на протяжении десятка, а то и сотни кадров. Иными словами, из ста одинаковых фотографий сохраняются все сто, а не одна.

Межкадровое сжатие работает по полярно противоположному принципу: при обработке сигнала, анализируется весь кадр, но сохраняются только ключевые изменения из кадра в кадр, как в мультипликации, когда нужно показать движение объекта, но фон заднего плана и окружающая объект обстановка одни и те же. Это позволяет существенно уменьшить размер видеофайла по сравнению с принципом внутрикадрового сжатия [1,2].

В стандарте MPEG-4 используется межкадровое сжатие. При этом передаются только изменяющие свое состояние, размеры и форму детали. Это позволяет существенно уменьшить размер видеофайла, но в некоторых случаях приводит к незначительной потере информации. Понять смысл межкадрового кодирования можно исходя из рисунка 1.

C:\Users\Кобра\Desktop\Clip2net_160110022319.png

Рис.1. Понятие работы межкадрового кодирования в стандарте MPEG-4

 

По блочной схеме кодера (рис.2), рассмотрим порядок сжатия данных по стандарту MPEG-4.

C:\Users\Кобра\Desktop\1.gif

Рис.2. Блочная схема кодера по стандарту MPEG-4

 

На вход видеокодера поступает входной кадр. Текущий входной кадр сравнивается со ссылочным кадром (блок оценки движения), в качестве которого может быть взят предыдущий закодированный кадр. Несколько предыдущих закодированных кадров хранятся в ЗУ (запоминающем устройстве). Функция оценки движения находит на ссылочном кадре макроблок, наиболее похожий на выбранный макроблок текущего кадра и смещение текущего макроблока относительно макроблока на ссылочном кадре фиксируется в виде вектора движения. Затем функция компенсации движения строит кадр-прогноз на основе найденного вектора движения и ссылочного кадра, взятого из ЗУ. Далее кадр-прогноз вычитается из текущего кадра. Их разность называется остаточным кадром.

Кадр-остаток поблочно преобразуется с помощью дискретного косинусного преобразования ДКП, после чего каждый блок квантуется. Далее сигнал поступает на вход буферного запоминающего устройства, которое оценивает поток видеоданных. На выходе буферного устройства получается сжатый поток битов.

Помимо кодирования, схема также обеспечивает реконструкцию данных. Она нужна для того, чтобы в кодере использовался точно такой же ссылочный кадр, как и в декодере. В таком случае в декодере не будут возникать дрейфы ошибок от изображения к изображению.

При реконструкции данных, к каждому квантованному макроблоку применяется деквантование и обратное косинусное преобразование. Кадр с компенсированным движением (кадр-прогноз) складывается с полученным остаточным кадром, в результате получается реконструированный кадр,который записывается в ЗУ. Так как процесс квантования необратим, он вносит искажения, и реконструированный кадр не совпадает с текущим.

Объем передаваемой информации сильно снижается за счет кодирования не каждого целого кадра последовательности видеоданных, а разности между кадрами. Энергия остаточного кадра много меньше энергии последовательности видеоданных- это видно на рисунке 3.

C:\Users\Кобра\Desktop\Clip2net_160110033051.png

Рис. 3. Кадры видеопоследовательности и их разность

 

На рисунке 3 нейтральный серый цвет соответствует нулевым разностям пикселей, а более яркий или более темный оттенок серого цвета соответствует положительным или отрицательным разностям. Применение компенсации движения позволяют еще больше уменьшить энергию остаточного кадра.

Поскольку движение объектов на видеосцене сконцентрировано вдоль блоков пикселей 16х16, то использование изменяющихся размеров блоков для компенсации и оценки движения принесет хорошую эффективность.

В иных случаях хорошее прогнозирование компенсации движения можно сделать на базе интерполированных (промежуточных) положений сэмплов на ссылочном кадре. Подпиксельный анализ и компенсация движения применяет при отыскании интерполированные пиксельные позиции вместе с целыми позициями. Кодер ищет позицию, обеспечивающее наилучшее совпадение макроблоков (т. е. минимизирует энергию остатка) на основе целых и дробных значений позиций для анализа компенсированного движения.

Рисунок 4 объясняет оценку движения с четвертьпиксельной точностью. На первой стадии отыскивается лучшее совпадение текущего макроблока по целочисленной решетке сэмплов (круги). Затем кодер делает поиск по позициям полупикселов сразу после найденной позиции (квадраты) в целях улучшения совпадения, а затем, если необходимо, совершает поиск с шагом в четверть пиксела (треугольники) для нахождения еще лучшего совпадения. Потом делается вычитание из текущего блока или макроблока его наилучшего прогноза, смещение (вектор компенсации движения) которого может быть кратно целым, половинам или четвертям пикселов.

C:\Users\Кобра\Desktop\Clip2net_160110035723.png

Рис. 4. Четвертьпиксельная интерполяция

 

Принимая во внимание, малая интерполяция дает отличные показатели компенсации движения, но при значительном повышении объема вычислений.Отыскание годных блоков 4 х 4 с интерполяцией по четвертьпикселам является трудным вопросом по аналогии с использованием блоков 16 х 16 без интерполяции. Кроме значимого возрастания сложности расчетов требуется расплачиваться огромным числом векторов движения для будущей реконструкции изображения. Во время уменьшений размеров блоков, требуется передавать больше векторов. Помимо вышесказанного, еще больше требуется использовать больше битов при представлении векторов по полупикселам и четвертьпикселам.

В любых кодерах, насколько они не были эффективны, все же существует ошибка нахождения векторов движения. Это хорошо видно из рисунка 5.

C:\Users\Кобра\Desktop\rubase_4_503057493_195043.jpg

Рис. 5. Ошибочно найденные векторы движения

 

На неподвижном фоне падающего «объекта» проявляются векторы движения при смещении макроблоков фона, равном нулю. Этот минус при кодировании будет отрицательно сказываться на сжатии видеоинформации.

Рассмотрим частотно-контрастные характеристики телевизионной камеры без применения коррекции (рис.6).

C:\Users\Кобра\Desktop\Clip2net_160110154547.png

Рис. 6. Частотно-контрастная характеристика телевизионной камеры

 

Рисунок 6 наглядно показывает, что основная энергия сосредоточена в области низких частот. На высоких частотах, как известно из курса схемотехники, на любые радиотехнические устройства влияют сильные шумы. Поэтому мы наблюдаем спад ЧКХ при увеличении частоты, что приводит к уменьшению четкости при наличии шумов [3].

Пространственные частоты изображения отражают коэффициенты косинусного преобразования, которое использует блоки, например, 8х8. Прямое преобразование FDCT (Forward DCT), примененное к блоку X размером NхN, задается следующей формулой:

, (1)

где X — это матрица сэмплов, У— матрица коэффициентов, а А — NхN матрица преобразования.

Элементы матрицы А можно найти по формуле:

,(2)

где , при i=0; , при i0.

Выражения для Х и Y можно переписать в виде сумм (3) и (4):

; (3)

. (4)

Выходом двухмерного FDCT служит матрица 8х8 коэффициентов, которая представляет блок сэмплов изображения в области преобразования DCT. Как видно из рисунка 7, ненулевые коэффициенты DCT обычно образуют кластер вокруг левого верхнего коэффициента с примерно симметричным распределением вдоль диагонали блока. Левый верхний коэффициент — отражает постоянную составляющую (DC), правый нижний — самую высокую пространственную частоту.

C:\Users\Кобра\Desktop\Clip2net_160110163137.png

Рис. 7. Коэффициенты дискретно-косинусного преобразователя

 

Следовательно, для исключения ошибок в нахождении векторов движения требуется искать вектора, начиная с низкочастотной области. Именно в этой области отношение сигнала к шуму много выше, чем в высокочастотной области. С увеличением частоты, будут и увеличиваться шумы, что приведет к увеличению ошибочных векторов движения. Но в данном случае отклонение будет не более чем на 8 элементов изображения, что не сильно скажется на увеличении ошибок. Этот принцип оценки движения может быть принят в последних версиях стандарта кодирования MPEG-4.

 

Литература:

 

  1.              Электронное ресурс, сайт: http://vidimost.com/shkola-videonabludeniya/statiy-o-videonabludeniy/kodirovanie-i-szhatie-tsifrovogo-videosignala/, дата обращения:11.01.2016г.
  2.              Электронный ресурс, сайт: http://www.spycams.ru/articles/kodirovanie-i-sjatie-cifrovogo-videosignala, дата обращения:11.01.2016г.
  3.              А. Н. Куликов, Журнал «Специальная Техника»,№ 2, 2002г.(http://www.bnti.ru/showart.asp?aid=573&lvl=19.01.01.&p=3 %E5).
  4.              И. В. Власюк., «Метод контроля пространственных характеристик телевизионных камер». Метрология и измерительная техника в связи. — 2005, — № 6. — С.13–16.
  5.              Ватолин Д., Ратушняк А., «Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео». — М.: ДИАЛОГ-МИФИ, 2003, 384 с.;
  6.              Ян Ричардсон, перевод с англ. Чепыжова В. В. «Видеокодирование. Н.264 и MPEG-4 –стандарты нового поколения», Москва: Техносфера, 2005, 368 с.;
Основные термины (генерируются автоматически): DCT, ссылочный кадр, FDCT, остаточный кадр, блочная схема, компенсация движения, левый верхний коэффициент, лучшее совпадение, оценка движения, телевизионная камера.


Ключевые слова

Стандарт MPEG-4, межполевое сжатие, кодирование в стандарте MPEG-4, видеокодер MPEG-4, покадровое сжатие., покадровое сжатие

Похожие статьи

О методах внедрения цифровых водяных знаков в потоковое видео

В данной статье дан обзор наиболее распространенных методов внедрения цифровых водяных знаков в потоковое видео, применяемые российскими и зарубежными специалистами. Рассмотрены такие алгоритмы, как дискретное косинусное преобразование, вейвлет-преоб...

Исследование методов субдискретизации цветного изображения

В работе рассматриваются методы цветной субдискретизации ТВ изображения в форматах 4:4:4 и 4:2:2. Приводятся их основные достоинства и недостатки, а также метод получения формата изображения 4:2:2 из исходного формата 4:4:4, что позволит сократить ра...

Использование кодеков в подготовке исходных данных для обучения искусственной нейронной сети

В данной работе решается задача подготовки исходных данных (обучающей выборки) для использования в обучении искусственной нейронной сети, распознающей образы в видео. Анализируется тенденции популярности тем «Большие данные» и «Глубокое обучение», а ...

Методы обработки видеоизображений с помощью языка программирования Python

В статье рассматриваются современные методы обработки видеоизображений с использованием языка программирования Python. Описываются ключевые библиотеки, такие как OpenCV и scikit-image, а также их применение для выполнения задач, включая распознавание...

Анализ методов синхронизации устройств с источником цифрового сигнала в системах цифровой обработки аудиоданных

В статье автор анализирует возможные схемы синхронизации источника цифрового сигнала и выносного блока цифро-аналогового преобразования. Рассмотрен вопрос синхронизации устройств с различающимися частотами дискретизации. Приведены достоинства и недос...

Перспективы использования интернет-сети в доставке ТВ-программ пользователям

Рассматриваются актуальные вопросы по IPTV и интернет-телевиденью. Приводятся структурные схемы, реализующие технологию Интернет-вещания, даётся краткая характеристика методов передачи трафика в IP-сетях: unicast, broadcast и multicast. Сравнение. IP...

Автоматизация поиска оптимальных параметров сетевого UDP-соединения в многопоточных Java-программах

Описан разработанный автором программный комплекс, позволяющий автоматизировать поиск оптимальных параметров сетевого соединения с учётом влияния следующих параметров: размер буфера сокетов, скорость передачи пакетов, закон распределения размера паке...

Оценка качества передачи речи в IP-телефонии

В статье рассматриваются методы оценки качества передачи речи в сетях IP-телефонии, с целью минимизировать затраты на повторную оценку, при изменении факторов влияния. Обоснован выбор метода оценки качества. Составлена сравнительная характеристика ра...

Разработка систем кадровой синхронизации цифровой системы передачи

Разработана система кадровой синхронизации цифровой телевизионной системы. Проведен статистический анализ исходных реализаций «белого» шума и синтезированных последовательностей для кадровой синхронизации систем цифрового телевидения. Осуществлен сра...

Внедрение цифровых технологий в процесс обучения аудиовизуальным дисциплинам

В статье рассматриваются приемы обучения аудиовизуальным технологиям. В это понятие входит обучение приемам записи звука на применяемые в данное время устройства записи аудио информации. Обучаются студенты и методам компьютерной обработки звуковых фа...

Похожие статьи

О методах внедрения цифровых водяных знаков в потоковое видео

В данной статье дан обзор наиболее распространенных методов внедрения цифровых водяных знаков в потоковое видео, применяемые российскими и зарубежными специалистами. Рассмотрены такие алгоритмы, как дискретное косинусное преобразование, вейвлет-преоб...

Исследование методов субдискретизации цветного изображения

В работе рассматриваются методы цветной субдискретизации ТВ изображения в форматах 4:4:4 и 4:2:2. Приводятся их основные достоинства и недостатки, а также метод получения формата изображения 4:2:2 из исходного формата 4:4:4, что позволит сократить ра...

Использование кодеков в подготовке исходных данных для обучения искусственной нейронной сети

В данной работе решается задача подготовки исходных данных (обучающей выборки) для использования в обучении искусственной нейронной сети, распознающей образы в видео. Анализируется тенденции популярности тем «Большие данные» и «Глубокое обучение», а ...

Методы обработки видеоизображений с помощью языка программирования Python

В статье рассматриваются современные методы обработки видеоизображений с использованием языка программирования Python. Описываются ключевые библиотеки, такие как OpenCV и scikit-image, а также их применение для выполнения задач, включая распознавание...

Анализ методов синхронизации устройств с источником цифрового сигнала в системах цифровой обработки аудиоданных

В статье автор анализирует возможные схемы синхронизации источника цифрового сигнала и выносного блока цифро-аналогового преобразования. Рассмотрен вопрос синхронизации устройств с различающимися частотами дискретизации. Приведены достоинства и недос...

Перспективы использования интернет-сети в доставке ТВ-программ пользователям

Рассматриваются актуальные вопросы по IPTV и интернет-телевиденью. Приводятся структурные схемы, реализующие технологию Интернет-вещания, даётся краткая характеристика методов передачи трафика в IP-сетях: unicast, broadcast и multicast. Сравнение. IP...

Автоматизация поиска оптимальных параметров сетевого UDP-соединения в многопоточных Java-программах

Описан разработанный автором программный комплекс, позволяющий автоматизировать поиск оптимальных параметров сетевого соединения с учётом влияния следующих параметров: размер буфера сокетов, скорость передачи пакетов, закон распределения размера паке...

Оценка качества передачи речи в IP-телефонии

В статье рассматриваются методы оценки качества передачи речи в сетях IP-телефонии, с целью минимизировать затраты на повторную оценку, при изменении факторов влияния. Обоснован выбор метода оценки качества. Составлена сравнительная характеристика ра...

Разработка систем кадровой синхронизации цифровой системы передачи

Разработана система кадровой синхронизации цифровой телевизионной системы. Проведен статистический анализ исходных реализаций «белого» шума и синтезированных последовательностей для кадровой синхронизации систем цифрового телевидения. Осуществлен сра...

Внедрение цифровых технологий в процесс обучения аудиовизуальным дисциплинам

В статье рассматриваются приемы обучения аудиовизуальным технологиям. В это понятие входит обучение приемам записи звука на применяемые в данное время устройства записи аудио информации. Обучаются студенты и методам компьютерной обработки звуковых фа...

Задать вопрос