Анализ последовательностей изображений | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 26 октября, печатный экземпляр отправим 30 октября.

Опубликовать статью в журнале

Автор:

Рубрика: Технические науки

Опубликовано в Молодой учёный №4 (108) февраль-2 2016 г.

Дата публикации: 16.02.2016

Статья просмотрена: 86 раз

Библиографическое описание:

Заглядов, П. В. Анализ последовательностей изображений / П. В. Заглядов. — Текст : непосредственный // Молодой ученый. — 2016. — № 4 (108). — С. 39-41. — URL: https://moluch.ru/archive/108/26057/ (дата обращения: 16.10.2024).

 

В данной статье рассматривается анализ движения сцены, который является одним из наиболее мощных источников информации при интерпретации изображения. Рассматриваемый анализ позволяет не только выявить и идентифицировать движущиеся объекты, но и определить трехмерную структуру сцены.

Ключевые слова: изображение, движение, кадр, свертка, оператор.

 

Анализ движения сцены является одним из наиболее мощных источников информации при интерпретации изображения. Такой анализ позволяет не только выявить и идентифицировать движущиеся объекты, но и определить трехмерную структуру сцены. В этой связи следует различать анализ движения объектов и движения наблюдателя. Можно выделить три уровня представления информации при анализе движения:

1)     выделение движущихся частей;

2)     измерение параметров движения;

3)     выделение пространственной информации.

В зависимости от конкретной задачи может оказаться достаточным, например, только первый уровень иди первые два. Ниже предлагается алгоритм оценки движения, не использующий явно соответствия между кадрами последовательности.

Предлагаемый алгоритм относится к классу так называемых «градиентных схем» и основан на анализе разницы между последовательными отфильтрованными кадрами. Основными этапами алгоритма являются:

1)        свертка каждого изображения последовательности с лапласианом колоколообразной (гауссовой) функции;

2)        выделение точек пересечения нулевого уровня на обработанных таким образом изображениях;

3)        расчет разности между парой последовательных обработанных кадров;

4)        расчет компоненты скорости в направлении, перпендикулярном контурной линии;

5)        грубая оценка тангенциальной компоненты скорости;

6)        поиск точек пересечения нулевого уровня на втором кадре, проектирующихся из первого кадра в направлении вектора скорости.

Наряду с обычно используемыми в подобных алгоритмах ограничениями в данном случае будет сделано дополнительное допущение о том, что для медленно перемещающихся объектов (по сравнению с частотой ввод кадров) вращательные движения объекта в большинстве случаев можно представить как последовательность элементарных поступательных перемещений в пространстве. Эта гипотеза позволяет существенно упростить алгоритм, и хотя можно привести примеры ситуаций, когда она неправомочна (вращение контура вокруг центра, расположенного вблизи него или на нем), эти ситуации сравнительно редки.

На первом этапе алгоритма — этапе свертки — чрезвычайно важным является вопрос о выборе адекватного размера функции («раскрыва колокола»). Результаты расчета компоненты скорости, перпендикулярной к контурной линии, будут достаточно точными лишь в том случае, если величина смешений на последовательных изображениях будет меньше примерно половины ширины области положительных значений маски, с которой производится свертка. Поэтому, чем выше частота ввода кадров, тем уже должна быть маска, необходимая для измерения скоростей в некотором заданном диапазоне. Одна из проблем, связанных с этим фактом, состоит в том, что необходимо иметь возможность выбора оператора, наилучшим образом отвечающего скорости контурной точки. Для определения адекватности оператора ниже предлагается специальный критерий

Перпендикулярная составляющая скорости рассчитывается по формуле:

где I отфильтрованное изображение, а оператор градиента. Для определения того, адекватен ли оператор локальной скорости участка сцены, рассчитывается отношение

, где

Если величина этого отношения окажется меньше 0,61 (которая отвечает ситуации, когда перпендикулярная компонента скорости равна половине размера маски), то данное измерение надежно. В соответствии с проведенными выше рассуждениями требуемый диапазон скоростей можно обеспечить, изменяя два параметра — частоту ввода изображений и размер фильтрующего оператора (если не считать еще фокусного расстояния объектива). Например, если частота ввода кадров составляет 70 Гц, а размер маски — 9 элементов изображения, то при таких параметрах можно измерять скорости до 315 элементов изображения в секунду.

Следующим этапом является определение истинного направления движения. Для этого принимается во внимание, что направление вектора скорости совпадает с направлением нормали к контурной линии в точке, где перпендикулярная составляющая скорости максимальна. В связи с этим рассчитывается гистограмма скоростей по каждой ориентации (суммы перпендикулярных компонент скорости для каждого направления), нормализованная по количеству контурных точек, отвечающих каждой ориентации. В случае чисто поступательного движения эта гистограмма имеет пик, соответствующий истинному направлению скорости. Описанный метод имеет недостаток, связанный с необходимостью проведения глобальных измерений по всему контуру, что не явно подразумевает, что весь контур движется в одном направлении. В большинстве случаев при больших частотах ввода это более или менее отвечает действительности. Достоинством же метода является его относительная простота и возможность быстрого получения результатов, которые можно использовать в качестве первого приближения для более точных алгоритмов. После того как направление движения определено, величину смешения можно рассчитать по перпендикулярной составляющей скорости. [1–6]

Последним этапом алгоритма является сопоставление точек пересечения нулевого уровня на двух последовательных изображениях серии. Это осуществляется с использованием информации, полученной на предыдущих этапах. Поиск осуществляется в окрестности точек нулевого уровня первого изображения пары в направлении вектора скорости, рассчитанного на предыдущем шаге. Этот этап не является обязательным для расчета параметров скорости, однако он важен при построении траекторий движущихся контуров. «Конечная точка», найденная на этом этапе, используется в качестве «начальной точки» при анализе следующего изображения серии. Таким путем удается проследить движение контура на серии изображений даже в том случае, если его форма меняется от кадра к кадру (например, вследствие изменений условий освещения).

 

Литература:

 

  1.      Поезжаева Е. В. Промышленные роботы: учеб.пособие: в 3 ч./ Е. В. Поезжаева. — Пермь Изд-во Пермь.гос, тех. ун-та, 2006.- Ч.1.-64 с.
  2.      Зенкевич С. Л., Ющенко А:.С. Управление роботами.- М.:Изд-во МГОУ им. Н. Э. Баумана, 2006.
  3.      Корендясев А. И. Теоретические основы робототехники: в 2 кн./ А. И. Корендясев, Б. Л. Саламандра, Л. И. Тывес; отв. Ред. С. М. Каплунов.– М.:Наука,2006.
  4.      Хорн Б. К. Зрение роботов.– М.:Мир,1989.
  5.      Михайлов С. В., Романов В. В., Заикин Д. А., Система технического зрения для диагностики процесса резания материалов//Вестник компьютерных и информационных технологий, 2007, № 4, стр. 23–26
  6.      В. И. Сырямкин, B. C. Титов, Ю. Г. Якушенков,Системы, технического зрения-МГП «РАСКО»,1992
Основные термины (генерируются автоматически): контурная линия, направление вектора скорости, нулевой уровень, перпендикулярная составляющая скорость, анализ движения, анализ движения сцены, большинство случаев, интерпретация изображения, кадр, мощный источник информации, перпендикулярная компонента скорости, трехмерная структура сцены, частота ввода кадров, элемент изображения.


Ключевые слова

оператор, движение, изображение, кадр, свертка, оператор.

Похожие статьи

Математическое моделирование систем распознавания изображений, содержащих текстовую информацию, на основе нейронных сетей

В данной статье приводится математическая модель системы распознавания изображений, содержащих текстовую информацию или использующих такую информацию при своей генерации. Предполагается, что рассматриваемые системы будет основаны на возможностях нейр...

Семантические доминанты в репрезентации образа женщины в рассказе А. Куприна «Просительница»

Данная статья посвящена выявлению основных характеристик, сущностных черт образа женщины в русской литературе с помощью метода графосемантического моделирования, которое проводилось по нескольким этапам: сбор материала исследования, компонентный анал...

Построение трёхмерной модели лица человека путём совмещения множеств трёхмерных точек

Возможности биометрической аутентификации по лицу человека при использовании обычной камеры ограничены точностью алгоритмов реконструкции трёхмерной геометрии по освещению лица. Такие алгоритмы постоянно совершенствуются, однако качество данных, полу...

Определение цвета и его функции в рекламе

Статья посвящена раскрытию самого определения цвета, обобщению его функций в рекламе. Многие рекламодатели сегодня не внимательно относятся к выбору цвета рекламного сообщения, тем самым занижая его эффективность в разы.

Компьютерные технологии диагностики автомобиля

Надежность автомобиля — один из важнейших показателей качества транспорт-ного средства. Данная статья посвящена вопросу применения компьютерных технологий в диагностики автомобиля. В статье рассматривается диагностика автомобиля на основе новейших ко...

Вопросно-ответная система, основанная на семантическом вероятностном выводе

Данная статья содержит описание методов извлечения ответов на простые вопросы и процесс логического вывода, который содержит действительность и контекстный охват ответа на вопросы со сложной структурой, путем доступа к богатой семантической структуре...

Текстовая классификация документов на основе текстовой сегментации

Целью данного исследования является разработка модели классификации текстовых документов с несколькими метками. Вкратце рассмотрены основые работы по данной проблематике. Основываясь на том, что текстовые документы хорошо организованы, некоторые част...

Сравнение и метафора в когнитивной лингвистике

В данной статье рассматриваются основные характеристики сравнения и метафоры, изучаемых в когнитивном аспекте. Связь таких языковых явлений с познавательной деятельностью вызывает в последнее время большой интерес, в связи с тем, что она помогает луч...

Покадровая съемка как прием показа динамики объектов и процессов

В статье рассматривается вопрос о новом творческом приеме для фотографов и видеооператоров. Авторы исследуют прием таймлапс как одну из технологий по сжатию времени при получении изображения. Итогом статьи является определение покадровой съемки как п...

Особенности функционирования графических стилистических средств в современной англоязычной рекламе

В статье проводится анализ передачи рекламной информации графическими средствами, рассматриваются особенности функционирования пунктуационных знаков, шрифтовыделения, пространственно-плоскостного варьирования, пиктограмм, цветовых решений и изображен...

Похожие статьи

Математическое моделирование систем распознавания изображений, содержащих текстовую информацию, на основе нейронных сетей

В данной статье приводится математическая модель системы распознавания изображений, содержащих текстовую информацию или использующих такую информацию при своей генерации. Предполагается, что рассматриваемые системы будет основаны на возможностях нейр...

Семантические доминанты в репрезентации образа женщины в рассказе А. Куприна «Просительница»

Данная статья посвящена выявлению основных характеристик, сущностных черт образа женщины в русской литературе с помощью метода графосемантического моделирования, которое проводилось по нескольким этапам: сбор материала исследования, компонентный анал...

Построение трёхмерной модели лица человека путём совмещения множеств трёхмерных точек

Возможности биометрической аутентификации по лицу человека при использовании обычной камеры ограничены точностью алгоритмов реконструкции трёхмерной геометрии по освещению лица. Такие алгоритмы постоянно совершенствуются, однако качество данных, полу...

Определение цвета и его функции в рекламе

Статья посвящена раскрытию самого определения цвета, обобщению его функций в рекламе. Многие рекламодатели сегодня не внимательно относятся к выбору цвета рекламного сообщения, тем самым занижая его эффективность в разы.

Компьютерные технологии диагностики автомобиля

Надежность автомобиля — один из важнейших показателей качества транспорт-ного средства. Данная статья посвящена вопросу применения компьютерных технологий в диагностики автомобиля. В статье рассматривается диагностика автомобиля на основе новейших ко...

Вопросно-ответная система, основанная на семантическом вероятностном выводе

Данная статья содержит описание методов извлечения ответов на простые вопросы и процесс логического вывода, который содержит действительность и контекстный охват ответа на вопросы со сложной структурой, путем доступа к богатой семантической структуре...

Текстовая классификация документов на основе текстовой сегментации

Целью данного исследования является разработка модели классификации текстовых документов с несколькими метками. Вкратце рассмотрены основые работы по данной проблематике. Основываясь на том, что текстовые документы хорошо организованы, некоторые част...

Сравнение и метафора в когнитивной лингвистике

В данной статье рассматриваются основные характеристики сравнения и метафоры, изучаемых в когнитивном аспекте. Связь таких языковых явлений с познавательной деятельностью вызывает в последнее время большой интерес, в связи с тем, что она помогает луч...

Покадровая съемка как прием показа динамики объектов и процессов

В статье рассматривается вопрос о новом творческом приеме для фотографов и видеооператоров. Авторы исследуют прием таймлапс как одну из технологий по сжатию времени при получении изображения. Итогом статьи является определение покадровой съемки как п...

Особенности функционирования графических стилистических средств в современной англоязычной рекламе

В статье проводится анализ передачи рекламной информации графическими средствами, рассматриваются особенности функционирования пунктуационных знаков, шрифтовыделения, пространственно-плоскостного варьирования, пиктограмм, цветовых решений и изображен...

Задать вопрос