Актуальность 2D алгоритмов в определенных задачах автоматического распознавания человека
Автор: Рожков Максим Михайлович
Рубрика: 1. Информатика и кибернетика
Опубликовано в
Статья просмотрена: 685 раз
Библиографическое описание:
Рожков, М. М. Актуальность 2D алгоритмов в определенных задачах автоматического распознавания человека / М. М. Рожков. — Текст : непосредственный // Технические науки: проблемы и перспективы : материалы I Междунар. науч. конф. (г. Санкт-Петербург, март 2011 г.). — Санкт-Петербург : Реноме, 2011. — С. 145-147. — URL: https://moluch.ru/conf/tech/archive/2/138/ (дата обращения: 16.11.2024).
Задач, в которых применяется тот или иной метод автоматического распознавания человека, на сегодняшний день много. Здесь и идентификация человека, и аутентификация, различные системы контроля доступа, системы, анализирующие большие скопления людей и т.д. Задач много. Каждая из них имеет свою специфику, свои требования на надежность распознавания, на дальность действия, на скорость работы, на целевые объекты. Ведь даже то обстоятельство, хочет ли объект (человек в данном случае), чтобы система его опознала, или ему все равно, или он не хочет – может серьезно повлиять на качество работы того или иного алгоритма в определенной ситуации.
Научное сообщество все более пристальное внимание уделяет алгоритмам, базирующимся на построении трехмерной модели человеческого лица – 3D алгоритмам. Как показывают эксперименты российских и зарубежных компаний и исследователей [3], [5], [2], 3D алгоритмы могут более точно распознавать человека. Кроме того, ощутимым плюсом таких алгоритмов является использование ими структурированной инфракрасной подсветки. Это обстоятельство делает алгоритмы нечувствительными к условиям освещенности.
Системы трехмерного распознавания, построенные с применением нескольких камер высокого разрешения (например [5]), создают в памяти системы трехмерный образ лица человека для того, чтобы его можно было «повернуть» в нужный ракурс – для обеспечения наилучших условий для двумерного распознавания.
Однако 3D алгоритмы более требовательны к входным данным. Для распознавания им, как правило, требуется наличие трехмерной модели в базе. Ведь именно трехмерная модель лица человека в базе позволяет 3D алгоритмам достигать высоких показателей точности распознавания. И сегодня такие системы развиваются в сторону повышения качества создания трехмерных моделей как для помещения их в базу, так и в качестве предъявляемых для сравнения.
Например, в рамках конкурса Национального института стандартов и технологий США Face Recognition Vendor Test (FRVT-2006) были получены любопытные результаты возможностей трехмерных алгоритмов. Была отмечена способность 3D-идентификации к выделению отличительных черт в поверхности лица человека. Например, характерных трехмерных кривых для линии глазниц, носа, подбородка, где ткани и кости выступают наиболее очевидно и почти не меняют форму со временем [4].
Еще одной особенностью систем, построенных на базе 3D распознавания в том, что человек должен быть достаточно близок к устройству сканирования и должен некоторое время оставаться неподвижным. Например, в системе A4Vision дальность, при которой обеспечивается надежная работа системы, составляет 1,5 метра [3]. Кроме того объект должен хотеть, чтобы система распознала его. И должен приложить некоторые усилия, например – посмотреть на небольшое зеркало, «застыть» на секунду и т.д.
Итак, основными недостатками 3D алгоритмов распознавания на сегодняшний день являются:
ограниченная дальность действия;
для надежного распознавания, как правило, объекты в базе должны быть достаточно хорошо известны системе (желательно, чтобы эти объекты были непосредственно представлены системе – для создания 3D-модели);
необходимость заинтересованности объекта в том, чтобы система распознала его.
Ограниченная дальность всегда будет являться тем критерием, по которому 3D алгоритмы будут проигрывать двумерным. Двумерные алгоритмы менее критичны к разрешению камер наблюдения. Следовательно, при использовании одинаковой аппаратуры двумерные алгоритмы будут иметь заведомо больший радиус действия. Двумерные алгоритмы можно использовать за горизонтом применимости трехмерных.
Если объект достаточно удален от камер, если он находится среди большого количества людей и при этом двигается, то 3D алгоритмы в таких случаях крайне затруднительно применять. Однако 2D алгоритмы, вполне могут работать в таких условиях. На общей фотографии выделить лицо. А затем обработать и попытаться идентифицировать человека.
Наличие в базе 3D алгоритмов трехмерных моделей лиц также не всегда возможно. Иногда необходимо идентифицировать человека, имея в наличии лишь его фотографию. Да и то зачастую невысокого качества. В таких случаях использовать 3D алгоритмы не представляется целесообразным: все их преимущества сходят на нет. И в таких случаях 2D алгоритмы, специально предназначенные для сравнения фотографий, будут в более выигрышной позиции.
Что же касается необходимости заинтересованности объекта в распознании, то оно вполне уместно в системах аутентификации. Когда человеку необходимо подтвердить свои полномочия – для доступа к чему либо. В таких системах можно потребовать от человека, чтобы он повернул лицо строго фронтально, можно обеспечить достаточную освещенность и т.д. А как быть, если человек не хочет помогать системам распознавания? Если такие системы призваны выявлять, к примеру, преступников среди множества людей в общественных местах? Если необходимо обеспечить независимость системы от желаний объекта «сотрудничать»?
Как заявляют сами разработчики из A4Vision, современный уровень развития технологии распознавания лиц позволяет ей работать только с объектами, заинтересованными в том, чтобы лицо было распознано системой. А вот технологии распознавания лиц, которая эффективно работала бы без согласия человека и незаметно для него до сих пор нет [3].
В ряде публикаций, посвященных распознаванию человека, рассматривается концепция так называемого «ненавязчивого распознавания». «Технологии для интеллектуальной среды не должны быть навязчивыми и должны предоставлять пользователю свободу действий» [1].
То есть технологии распознавания должны действовать незаметно для человека, не создавая ему помех. Почему так? Во-первых, потому что это даст толчок широкому распространению таковых технологий. Это будет удобно и необременительно для человека. Во-вторых, потому что именно так и распознает один человек другого человека. Общаясь, люди не сканируют сетчатку друг друга, не рассчитывают межглазовое расстояние. Они распознают друг друга легко и непринужденно.
Подведем итоги. 2D алгоритмы распознавания человека по лицу до сих пор весьма актуальны. Они, безусловно, могут проигрывать трехмерным алгоритмам по точности распознавания, однако они не исчерпали полностью своих возможностей. Кроме того, в определенных задачах они имеют ряд бесспорных преимуществ перед 3D алгоритмами:
они имеют большую дальность применения;
они менее требовательны к входным данным, могут работать с фотографиями невысокого качества;
они менее требовательны к вычислительным ресурсам;
они ненавязчивы и незаметны, не требуют от объекта каких-то специальных действий.
Литература:
А.Пентланд, Т.Чаудхари. Распознавание лиц для интеллектуальных сред. http://www.osp.ru/os/2000/03/177939/
Ш.Панканти, Р.М.Болле, Э.Джейн. Биометрия: будущее идентификации. IEEE Computer, February 2000, pp. 46-49 http://www.osp.ru/os/2000/03/177933/
Технология трехмерного распознавания лиц. http://www.procctv.ru/page.php?id=450
К.Берд. Лица, подлежащие опознанию. Опубликовано 07 ноября 2007. http://www.computerra.ru/magazine/338239/
VOCORD FaceControl. Cистема некооперативного выделения и распознавания лиц. http://www.vocord.ru/493/