Влияние контраста и шума на распознавание изображений нейронной сетью YOLOv3 | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 28 декабря, печатный экземпляр отправим 1 января.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №23 (365) июнь 2021 г.

Дата публикации: 01.06.2021

Статья просмотрена: 311 раз

Библиографическое описание:

Чивонго, Верданд Емил Сигфрид. Влияние контраста и шума на распознавание изображений нейронной сетью YOLOv3 / Верданд Емил Сигфрид Чивонго. — Текст : непосредственный // Молодой ученый. — 2021. — № 23 (365). — С. 117-120. — URL: https://moluch.ru/archive/365/81798/ (дата обращения: 18.12.2024).



Показано, что для распознавания изображений с помощью нейронной сети YOLOv3 желательно поддерживать контраст не менее 0,3 и отношение сигнал/шум не ниже 15 дБ, иначе вероятность правильного распознавания может оказаться ниже 0,9.

Ключевые слова: нейронная сеть, распознавание изображения, контраст, аддитивный нормальный шум.

Применение искусственных нейронных сетей для решения практических задач становится все более широким [1]. Нейронная сеть YOLOv3 [2] для распознавания объектов на изображениях получила популярность в связи с ее высокой производительностью. Однако, в некоторых применениях, например, в системах обнаружения дронов [3], нужно знать те особенности и характеристики сети, которые мало представлены в доступных источниках. В частности, нужно знать, как сеть будет реагировать на условия плохого освещения, что приводит к низкому контрасту и зашумленности входных изображений.

В связи с этим цель данной работы состояла в том, чтобы получить зависимости вероятности правильного распознавания от контраста и отношения сигнал/шум на изображениях.

Контраст (контрастность) K вычислялся как отношение:

,

где:

W — яркость наиболее светлого пикселя;

B — яркость наиболее темного пикселя.

Были созданы три набора данных, которые содержали по 60 изображений с различным контрастом (примеры приведены на рис. 1).

Изображения из наборов A1C (слева), A2C (посредине) и A3C (справа) с контрастом 1 (вверху) и 0,33 (внизу)

Рис. 1. Изображения из наборов A1C (слева), A2C (посредине) и A3C (справа) с контрастом 1 (вверху) и 0,33 (внизу)

Изображения распознавались с помощью нейронной сети ImageAI YOLOv3, которая запускалась в облачной среде Google Colab. Результаты обработки приведены на рис. 2.

Влияние контраста на вероятность правильного распознавания

Рис. 2. Влияние контраста на вероятность правильного распознавания

Из них видно, что снижение контраста менее значения 0,3 нежелательно, так как легко может привести к падению вероятности правильного распознавания ниже 0,9.

Воздействие аддитивного шума моделировалось путем его сложения с исходным изображением контраста 0,33. Программная модель создавала нормальный некоррелированный шум. Были созданы три набора данных по 60 изображений с различным уровнем шума. Примеры из набора A1N приведены на рис. 3.

Изображения с отношениями сигнал/шум 30 дБ, 20 дБ и 10 дБ

Рис. 3. Изображения с отношениями сигнал/шум 30 дБ, 20 дБ и 10 дБ

Отношение сигнал/шум в децибелах (дБ) вычислялось через логарифм отношения размаха полезного видеосигнала к среднеквадратичному значению шума:

,

где:

– SNR — отношение сигнал/шум, дБ;

W — яркость наиболее светлого пикселя до внесения шума;

B — яркость наиболее темного пикселя до внесения шума;

N — среднеквадратическое отклонение шума яркости пикселей.

Результаты обработки приведены на рис. 4. По ним видно, что ухудшение отношения сигнал/шум ниже 15 дБ вполне может снизить вероятность правильного распознавания ниже 0,9. Можно также предположить, что чем меньше площадь объекта на изображении при прочих равных условиях, тем значительнее влияние шума.

Влияние шума на вероятность правильного распознавания

Рис. 4. Влияние шума на вероятность правильного распознавания

Например, объекты на изображениях наборов A1N, A2N и A3N имели одинаковые линейные размеры около 100 пикселей, но разную площадь, в A1N — наименьшую, в A3N — наибольшую. Соответственно, на A1N шум оказал наибольшее влияние, на A3N — наименьшее.

В целом можно сделать вывод, что при работе с нейронной сетью YOLOv3 желательно поддерживать контраст не менее 0,3 и отношение сигнал/шум не ниже 15 дБ.

В ходе дальнейшей работы предполагается провести аналогичные исследования для нейронных сетей TinyYOLOv3 и RetinaNet.

Литература:

1. Official English Documentation for ImageAI!. — Текст: электронный // Moses Olafenwa and John Olafenwa: [сайт]. — URL: https://imageai.readthedocs.io/en/latest/ (дата обращения: 25.05.2021).

2. Redmon J., Farhadi A. Yolov3: An incremental improvement. — Текст: электронный // arXiv: [сайт]. — URL: https://arxiv.org/pdf/1804.02767.pdf (дата обращения: 25.05.2021).

3. Samaras S. et al. Deep learning on multi sensor data for counter UAV applications—A systematic review //Sensors. — 2019. — Т. 19. — №. 22. — С. 4837.

Основные термины (генерируются автоматически): правильное распознавание, нейронная сеть, изображение, шум, SNR, влияние шума, внесение шума, набор данных, светлый пиксель, темный пиксель.


Ключевые слова

нейронная сеть, контраст, распознавание изображения, аддитивный нормальный шум

Похожие статьи

Влияние поворота изображения объекта на распознавание нейронной сетью ImageAI YOLOv3

Показано, что обученная реализация нейронной сети YOLOv3 на ресурсе ImageAI не обладает устойчивостью к поворотам изображения.

Влияние масштабирования на распознавание объектов нейронной сетью ImageAI YOLOv3

Исследовано влияние масштабирования изображения объекта на вероятность правильного распознавания нейронной сетью YOLOv3. Получена оценка минимально допустимого размера объекта на изображении.

Моделирование особенностей бинаурального слуха и исследование спектрального состава звуковых сигналов

В статье проводится исследование трех моделей бинаурального восприятия, характеристик и демаскирующих признаков при бинауральном восприятии речевого сигнала, моделируются особенности бинаурального слуха с помощью применения языка разработки LabVIEW N...

Алгоритм обновления биометрического шаблона с применением нейронной сети

Биометрическое распознавание человека является очень актуальной темой в современном мире. Существует множество уникальных характеристик человека, по которым можно проводить распознавание. Такими характеристиками, например, являются лицо, радужная обо...

Использование нейросетевых технологий в задаче автоматического распознавания эмоций

В статье представлены основные этапы разработки системы автоматического распознавания лицевых эмоций на основе нейронных сетей. Описываемая система способна распознать шесть базовых типов эмоций (удивление, страх, отвращение, злость, радость, грусть)...

Использование обобщенных параметров группирующихся стираний и ошибок для адаптивного выбора длины блока в системах передачи данных

В статье рассмотрена иерархическая модель источника ошибок и стираний, описываемая моделью Пуртова с Марковской цепью переходов состояний при передаче данных по нестационарным каналам. Установлена зависимость степени группирования, средней кратности ...

Реализация прямой структуры КИХ-фильтра в среде Matlab

Произведено моделирование прямой структуры цифрового фильтра с конечной импульсной характеристикой. Показано, что расхождение между расчётной АЧХ и огибающей выходного сигнала модели объясняется наличием шумов квантования и динамической работой систе...

Протокол передачи данных для устройства ввода информации

Показано, что создаваемый протокол передачи данных использует время-импульсную модуляции, особенностью которой является большая разница между нулями и единицами. Приведены необходимые диаграммы. Отмечается, что увеличение количества датчиков ведет к ...

Исследование эффективности гибридной нейросетевой архитектуры в контексте прогностического анализа энергопотребления в зданиях коммерческого назначения

Точное предсказание энергопотребления зданий играет важную роль в оптимизации планирования энергетических систем объектов. Энергопотребление зданий подвержено воздействию различных факторов и характеризуется как нелинейное, так и нестационарное явлен...

Модель цифрового фильтра с фазовращателем в среде MATLAB

В статье описано создание модели цифрового фильтра частотной выборки с фазовращателем на основе повышенной чувствительности.

Похожие статьи

Влияние поворота изображения объекта на распознавание нейронной сетью ImageAI YOLOv3

Показано, что обученная реализация нейронной сети YOLOv3 на ресурсе ImageAI не обладает устойчивостью к поворотам изображения.

Влияние масштабирования на распознавание объектов нейронной сетью ImageAI YOLOv3

Исследовано влияние масштабирования изображения объекта на вероятность правильного распознавания нейронной сетью YOLOv3. Получена оценка минимально допустимого размера объекта на изображении.

Моделирование особенностей бинаурального слуха и исследование спектрального состава звуковых сигналов

В статье проводится исследование трех моделей бинаурального восприятия, характеристик и демаскирующих признаков при бинауральном восприятии речевого сигнала, моделируются особенности бинаурального слуха с помощью применения языка разработки LabVIEW N...

Алгоритм обновления биометрического шаблона с применением нейронной сети

Биометрическое распознавание человека является очень актуальной темой в современном мире. Существует множество уникальных характеристик человека, по которым можно проводить распознавание. Такими характеристиками, например, являются лицо, радужная обо...

Использование нейросетевых технологий в задаче автоматического распознавания эмоций

В статье представлены основные этапы разработки системы автоматического распознавания лицевых эмоций на основе нейронных сетей. Описываемая система способна распознать шесть базовых типов эмоций (удивление, страх, отвращение, злость, радость, грусть)...

Использование обобщенных параметров группирующихся стираний и ошибок для адаптивного выбора длины блока в системах передачи данных

В статье рассмотрена иерархическая модель источника ошибок и стираний, описываемая моделью Пуртова с Марковской цепью переходов состояний при передаче данных по нестационарным каналам. Установлена зависимость степени группирования, средней кратности ...

Реализация прямой структуры КИХ-фильтра в среде Matlab

Произведено моделирование прямой структуры цифрового фильтра с конечной импульсной характеристикой. Показано, что расхождение между расчётной АЧХ и огибающей выходного сигнала модели объясняется наличием шумов квантования и динамической работой систе...

Протокол передачи данных для устройства ввода информации

Показано, что создаваемый протокол передачи данных использует время-импульсную модуляции, особенностью которой является большая разница между нулями и единицами. Приведены необходимые диаграммы. Отмечается, что увеличение количества датчиков ведет к ...

Исследование эффективности гибридной нейросетевой архитектуры в контексте прогностического анализа энергопотребления в зданиях коммерческого назначения

Точное предсказание энергопотребления зданий играет важную роль в оптимизации планирования энергетических систем объектов. Энергопотребление зданий подвержено воздействию различных факторов и характеризуется как нелинейное, так и нестационарное явлен...

Модель цифрового фильтра с фазовращателем в среде MATLAB

В статье описано создание модели цифрового фильтра частотной выборки с фазовращателем на основе повышенной чувствительности.

Задать вопрос