Комбинаторная теория переобучения: оценка расслоения-связности | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 30 ноября, печатный экземпляр отправим 4 декабря.

Опубликовать статью в журнале

Авторы: ,

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №19 (309) май 2020 г.

Дата публикации: 09.05.2020

Статья просмотрена: 15 раз

Библиографическое описание:

Акбаров, Б. Х. Комбинаторная теория переобучения: оценка расслоения-связности / Б. Х. Акбаров, У. М. Негматов. — Текст : непосредственный // Молодой ученый. — 2020. — № 19 (309). — С. 104-106. — URL: https://moluch.ru/archive/309/69693/ (дата обращения: 16.11.2024).



Статья содержит краткий обзор теории расслоения-связности комбинаторной теории переобучения.

Ключевые слова: ИИ, переобучения, оценка, обобщающая способность, комбинаторная теория.

The article contains a brief review of the bundle-connected theory of the combinatorial theory of overfitting.

Keywords: AI, overfitting, assessment, generalization ability, combinatorial theory.

В теории обучения одной из главных проблем является оценка вероятностей ошибок исходя из семейства алгоритмов, обучающей выборки и метода обучения. Уменьшение количества оценок позволяет создавать алгоритмы, обобщающую способность, которых можно контролировать. В большинстве случаев решения — не оптимальны. При комбинаторном подходе вместо вероятности ошибки оценивается средняя ошибка на неизвестной контрольной выборке, что не меняет сути оценок [3].

Постановка задачи, определения и обозначения приведены в [3].

Оценки вероятности переобучения

Будем полагать, что все алгоритмы из A имеют попарно различные векторы ошибок. Введём на A естественное отношение порядка:

и

Для постройки отношений между алгоритмами a и b используем метрику. В качестве функции расстояния между векторами ошибок используем хэммингово расстояние, и обозначаем через .

Если и при этом то будем говорить, что предшествует и записывать . Очевидно, что .

Графом расслоения–связности множества алгоритмов A будем называть направленный граф с множеством рёбер

Граф расслоения–связности является дольным, много-дольным, доли соответствуют слоям алгоритмов рёбрами могут соединяться только алгоритмы соседних слоёв. Каждому ребру соответствует единственный объект, такой, что и .

Верхней (нижней) связностью алгоритма будем называть число рёбер графа, исходящих из (входящих в) вершину , соответственно:

Связность есть реализуемое семейством число способов изменить алгоритм a так, чтобы он стал делать на одну ошибку больше (или меньше). Связность можно интерпретировать как число степеней свободы семейства в локальной окрестности алгоритма . Для семейства линейных классификаторов значение связности концентрируется вокруг значения размерности пространства [4].

Не оптимальностью алгоритма будем называть число объектов , на которых алгоритм ошибается, при том, что существует алгоритм , , не ошибающийся на

.

Другими словами, есть число различных объектов , соответствующих всевозможным рёбрам на путях, ведущих к вершине .

В общем случае . Равенство достигается на всех алгоритмах двух самых нижних слоёв. Равенство достигается в случае, когда существует корректный алгоритм .

Оценка расслоения–связности: Теорема.

Определим для всех функцию гипергеометрического распределения:

Пусть метод минимизации эмпирического риска, векторы ошибок всех алгоритмов из попарно различны. Тогда для любого .

,

где верхняя связность и не оптимальность алгоритма a соответственно,

Рассмотрим основные свойства данной оценки.

1. Комбинаторный множитель есть верхняя оценка вероятности получить алгоритм в результате обучения. Величина экспоненциально убывает с ростом не оптимальности и связности . Это указывает на пару важных для практики вывода.

Во-первых, связные множества алгоритмов менее подвержены переобучению. Это относится широкому классу параметрических семейств алгоритмов классификации, у которых разделяющая поверхность непрерывна по параметрам.

Во-вторых, лишь несколько нижних слоёв вносят существенный вклад в переобучение. Это позволяет вычислять приближённые (нижние) оценки , перебирая алгоритмы по слоям снизу вверх. Из-за того, что в нижних слоях находится обычно очень малое количество алгоритмов, то оценки могут быть эффективно вычислены.

  1. Если пренебречь расслоением и связностью, положив для каждого , то получится оценка Вапника–Червоненкиса (при ):

.

  1. Оценка расслоения–связности является достижимой. Она обращается в равенство в случае специальных модельных семейств алгоритмов монотонных цепей и многомерных сетей.

Литература:

  1. Игнатьев Н. А. Обобщенные оценки и локальные метрики объектов в интеллектуальном анализе данных. Ташкент: Университет, 2014. C. 68–72.
  2. Мадрахимов III.Ф., Саидов Д. Ю. Устойчивость объектов классов и группировка признаков // Проблемы вычислительной и прикладной математики. 2016. № 3 (5). С. 50–55.
  3. Воронцов К. В. Комбинаторный подход к оценке качества обучаемых алгоритмов // Математические вопросы кибернетики / Под ред. О. Б. Лупа-нова. М.: Физматлит, 2004. Т. 13. С. 5–36.
  4. Кочедыков Д. А. Структуры сходства в семействах алгоритмов классификации и оценки обобщающей
  5. Воронцов К. В. Комбинаторная теория переобучения: результаты, приложения и открытые проблемы // Всероссийская конференция «Математические методы распознавания образов». Петрозаводск, 2011 г. C.:2–7.
Основные термины (генерируются автоматически): алгоритм, вектор ошибок, граф расслоения, обобщающая способность, оптимальность алгоритма, оценка, оценка расслоения, связность.


Ключевые слова

оценка, ИИ, переобучения, обобщающая способность, комбинаторная теория

Похожие статьи

Моделирование комбинаторных систем при помощи сводимости

Статья посвящена моделированию систем, ее реализации в компьютере, в частности с использованием сводимости, в то же время рассматривается теория алгоритмов и возможность ее применения к моделированию.

Общая теория уязвимостей компьютерных систем

В статье рассматривается гипотетическая возможность создания общей теории уязвимостей компьютерных систем и её аспекты.

Сравнительный анализ численного решения задач оптимального управления

Данная работа посвящена анализу численных методов решения задач оптимального управления: метода последовательных приближений и метода вариации. Работа данных алгоритмов была апробирована на конкретном тестовом примере с известным аналитическим решени...

Математическое моделирование задачи синтеза интегрированной системы безопасности с применением экспертных оценок

В работе рассматривается формализация проблемы синтеза интегрированной системы безопасности в виде задачи целочисленного программирования с использованием метода экспертных оценок для определения вычислительных параметров.

Методика определения ресурсоемкости проекта некомбинаторным методом

Статья посвящена описанию методики определения ресурсоемкости проекта, в частности в части трудовых ресурсов некомбинаторным способом, что существенно упрощает вычислительную сложность задачи.

Применение вычислительного дизайна при разработке рационального очертания пространственной стержневой конструкции

В статье авторы рассматривают моделирование пространственной стержневой системы с помощью методов вычислительного дизайна. Исследуют применимость алгоритмического проектирования в задачах моделирования однослойных стержневых оболочек с треугольным де...

Математическое моделирование банкротства предприятия

В данной статье исследуются различные механизмы выплат долгов кредиторам при банкротстве предприятия. Особый интерес представляют механизмы, использующие методы математической теории игр. Проведен обзор задачи в статическом случае и предложен новый п...

Разбиение многосвязного ортогонального полигона с минимизацией протяженности стыков на основе линейного программирования

Рассматривается задача разбиения многосвязного ортогонального полигона на прямоугольные области. Критерием оптимизации является минимизация протяженности стыков между прямоугольниками, образующими разбиение. Предложена модификация модели Бизли для ре...

Моделирование многоканальной открытой системы массового обслуживания с ограничениями. Определение аналитических формул

Рассматривается численная модель открытой системы массового обслуживания с ограничениями. Изложен процесс получения некоторых неизвестных аналитических формул характеристик системы на основе вспомогательных функций программы, реализующей данную модел...

Программная реализация метода оценки погрешностей результатов картирования в рамках сплайн-аппроксимационного подхода

В настоящей работе рассматриваются ключевые особенности и достоинства сплайн-аппроксимационного подхода к построению карт, описывается способ оценки влияния погрешностей в исходных данных на результаты картопостроения. Приводятся результаты вычислите...

Похожие статьи

Моделирование комбинаторных систем при помощи сводимости

Статья посвящена моделированию систем, ее реализации в компьютере, в частности с использованием сводимости, в то же время рассматривается теория алгоритмов и возможность ее применения к моделированию.

Общая теория уязвимостей компьютерных систем

В статье рассматривается гипотетическая возможность создания общей теории уязвимостей компьютерных систем и её аспекты.

Сравнительный анализ численного решения задач оптимального управления

Данная работа посвящена анализу численных методов решения задач оптимального управления: метода последовательных приближений и метода вариации. Работа данных алгоритмов была апробирована на конкретном тестовом примере с известным аналитическим решени...

Математическое моделирование задачи синтеза интегрированной системы безопасности с применением экспертных оценок

В работе рассматривается формализация проблемы синтеза интегрированной системы безопасности в виде задачи целочисленного программирования с использованием метода экспертных оценок для определения вычислительных параметров.

Методика определения ресурсоемкости проекта некомбинаторным методом

Статья посвящена описанию методики определения ресурсоемкости проекта, в частности в части трудовых ресурсов некомбинаторным способом, что существенно упрощает вычислительную сложность задачи.

Применение вычислительного дизайна при разработке рационального очертания пространственной стержневой конструкции

В статье авторы рассматривают моделирование пространственной стержневой системы с помощью методов вычислительного дизайна. Исследуют применимость алгоритмического проектирования в задачах моделирования однослойных стержневых оболочек с треугольным де...

Математическое моделирование банкротства предприятия

В данной статье исследуются различные механизмы выплат долгов кредиторам при банкротстве предприятия. Особый интерес представляют механизмы, использующие методы математической теории игр. Проведен обзор задачи в статическом случае и предложен новый п...

Разбиение многосвязного ортогонального полигона с минимизацией протяженности стыков на основе линейного программирования

Рассматривается задача разбиения многосвязного ортогонального полигона на прямоугольные области. Критерием оптимизации является минимизация протяженности стыков между прямоугольниками, образующими разбиение. Предложена модификация модели Бизли для ре...

Моделирование многоканальной открытой системы массового обслуживания с ограничениями. Определение аналитических формул

Рассматривается численная модель открытой системы массового обслуживания с ограничениями. Изложен процесс получения некоторых неизвестных аналитических формул характеристик системы на основе вспомогательных функций программы, реализующей данную модел...

Программная реализация метода оценки погрешностей результатов картирования в рамках сплайн-аппроксимационного подхода

В настоящей работе рассматриваются ключевые особенности и достоинства сплайн-аппроксимационного подхода к построению карт, описывается способ оценки влияния погрешностей в исходных данных на результаты картопостроения. Приводятся результаты вычислите...

Задать вопрос