Мягкая вероятность ошибки при приближённых описаниях объектов | Статья в сборнике международной научной конференции

Отправьте статью сегодня! Журнал выйдет 30 ноября, печатный экземпляр отправим 4 декабря.

Опубликовать статью в журнале

Библиографическое описание:

Молодцов, Д. А. Мягкая вероятность ошибки при приближённых описаниях объектов / Д. А. Молодцов, Д. В. Ковков. — Текст : непосредственный // Современные тенденции технических наук : материалы II Междунар. науч. конф. (г. Уфа, май 2013 г.). — Т. 0. — Уфа : Лето, 2013. — С. 10-14. — URL: https://moluch.ru/conf/tech/archive/74/3892/ (дата обращения: 16.11.2024).

В работе приводится идеология мягкой вероятности, которая основана на концепции приближённых описаний объектов. Вводятся статистическая база и регулярность, а также приближённая дисперсия. Устанавливается аналог неравенства Чебышёва для мягкой вероятности.

Ключевые слова: мягкая вероятность, смена гипотез, мягкое неравенство Чебышёва.

1. Что такое мягкая вероятность?

Под статистической регулярностью обычно понимают статистическую устойчивость частот появления различных исходов. Обычно это понятие обсуждается на примере бросания монеты. Иногда [1] авторы намечают более конструктивные пути формирования этого понятия, но окончательной формализации статистической устойчивости так и не приводится. Таким образом, важнейший вопрос о применимости теории к реальным явлениям остается, по сути, не решённым. Мягкая вероятность [2–7] это просто логическое завершение конструкции статистической регулярности.

2. Статистическая база данных

Сначала введем основное пространство исходов . При каждом испытании происходит появление в качестве результата испытаний одного из элементов множества . Статистическая база данных это просто конечная упорядоченная последовательность исходов , .

Событием  будем называть подмножество множества , . Будем считать, что событие произошло при некотором испытании, если результат испытания принадлежит этому событию. Нам нужно описать статистическую регулярность появления события . Содержательно статистическая регулярность означает близость частот для заданного множества выборок. Поэтому для формализации этого понятия необходимо, прежде всего, задать множество выборок для статистической базы данных.

Под выборкой  будем понимать просто указание мест в последовательности , которые входят в эту выборку, другими словами выборка это подмножество  множества .

При задании множества выборок естественно, прежде всего, контролировать их мощность, поэтому мы введем параметр для задания мощности выборки. В качестве допустимого множества выборок мы будем рассматривать произвольные выборки мощности m, которые состоят из последовательных элементов множества  и не являются слишком «старыми». Такое множество выборок обозначим

.

По-видимому, множество  является минимальным набором выборок, которые естественно рассматривать для определения статистической регулярности. Возможны, конечно, и другие определения допустимого множества выборок, при этом получится другое определение статистической регулярности, важно чтобы эти множества выборок всегда были точно заданы.

Частотой события  на выборке  будем называть величину

.

Здесь обозначено  — мощность множества , .

3. Статистическая регулярность

Теперь статистическую регулярность появления события  естественно понимать, как малое отличие частот события  на любых допустимых выборках из множества . Сформулируем это понятие более формально.

Определение 1. Событие  называется статистически -регулярным на базе , если для любых выборок  выполнено

.

Случайной функцией  мы будем называть любую функцию, принимающую вещественные значения и заданную на множестве , ,  — множество действительных чисел. Примером такой функции является характеристическая функция множества .

Средним значением случайной функции  на выборке  будем называть величину

.

Определение 2. Случайная функция  называется статистически -регулярной на базе , если для любых выборок  выполнено

.

Таким образом, статистическая регулярность события это просто статистическая регулярность характеристической функции этого события.

Условию регулярности случайной функции можно придать другую эквивалентную форму. Обозначим

,

.

Нетрудно видеть, что статистическая регулярность функции  эквивалентна выполнению неравенства .

Для любых выполнено неравенство . Отсюда легко следует, что статистическая регулярность функции  эквивалентна выполнению неравенства или включения для любых . Последнее включение также эквивалентно включению

.

Это обстоятельство делает естественным введение следующего определения.

Определение 3. Отрезок

называется -приближенным средним случайной функции  на базе .

Левый и правый конец отрезка будем обозначать четами снизу и сверху

.

4. Гипотезы о поведении случайной функции

Основываясь на понятии статистической регулярности случайной функции можно сформулировать два типа гипотезы о будущем поведении значений случайной функции. Фактически это гипотезы о будущих значениях статистической базы данных.

Определение 4. База данных называется статистически -регулярной относительно случайной функции , если для любых выборок  выполнено

.

Определение 5. База данных называется статистически значимо -регулярной относительно случайной функции , если для любых выборок  выполнено

.

Наряду со случайной функцией рассмотрим случайную функцию равную модулю отклонения функции от отрезка , то есть

.

Определение 6. Будем говорить, что для базы данных выполнена гипотеза -дисперсии относительно случайной функции , если база данных является статистически значимо -регулярной относительно случайной функции , то есть для любых выборок  выполнено

.

5. Свойства приближенного среднего случайной функции

Приближенное среднее обладает свойствами аналогичными свойствам классического математического ожидания. Неравенства для интервалов понимаются покомпонентно, то есть для каждого из концов отрезка.

1. .

2. Если  для любых , то .

3. , , .

4. , .

5..

6..

7. , .

6. Приближенная дисперсия случайной величины

В классической вероятности дисперсия случайной величины определяется как математическое ожидание квадрата разности этой величины и ее математического ожидания. Математическое ожидание случайной функции это просто некоторое число.

В нашем случае приближенное среднее является параметрическим семейством интервалов, которое характеризует случайную величину на некоторой базе данных. Если же говорить о гипотезах, использующих понятие статистической значимой регулярности, то они используют ограничения на приближенные средние. Сами эти отрезки, описывающие ограничения, не обязаны быть равными приближенным средним. Поэтому и понятие приближенной дисперсии удобно формулировать, как меру отклонения случайной величины от некоторого отрезка, а не от приближенного среднего.

Определение 7. Приближенной -дисперсией случайной функции  на базе называется -приближенная средняя случайной функции , то есть отрезок

.

Приведем простейшие свойства приближенной дисперсии.

1. .

2. , , .

3. .

4. .

5. .

6. , .

7. , .

7. Неравенство Чебышева для мягкой вероятности

Утверждение 1. Неравенство Чебышева. Пусть случайная функция  неотрицательна всюду на  и . Тогда справедливо неравенство

.

Доказательство. Если случайная функция неотрицательна всюду на , тогда легко видеть, что при  для любого  выполнено

.

По свойству 2 приближенного среднего имеем

.

Приближенное среднее от характеристической функции множества это мягкая вероятность множества, поэтому для мягкой вероятности множества  имеем оценку

.

Напомним, что неравенство интервальное. Утверждение доказано.

Пусть уже произвольная случайная функция. Для функции имеем

.

Поскольку неравенства  и , где , эквивалентны, получаем

,

а значит, имеет место и такое неравенство

.

Возьмем теперь в качестве неотрицательной случайной функции функцию , где произвольная случайная функция. Применим к  неравенство Чебышева и получаем

.

После элементарных преобразований имеем

.

Отсюда следует другая форма этого неравенства

.

Итак, неравенство Чебышева дает оценку мягкой вероятности «больших» отклонений, используя приближенное среднее или приближенную дисперсию. Если мы имеем дело с известной нам базой данных, то эта информация малоценна, так как легко напрямую точно подсчитать любые вероятностные характеристики, включая вероятность «больших» отклонений. По-видимому, более интересно использовать это неравенство для оценки вероятности случайной функции для будущей базы данных. Естественно для этого необходимо сделать соответствующие гипотезы о приближенном среднем или приближенной дисперсии. Однако при наличии гипотез представляет интерес найти точные оценки вероятности больших отклонений.

9. Заключение

Итак, работать с мягкими вероятностями вполне возможно, невзирая на наличие параметров и интервальный вид мягкой вероятности. Конечно, теперь актуально решение более сложных задач по подсчету различных вероятностей и других характеристик при наличии нескольких гипотез, причем возможно разного типа.

Особый интерес представляет применение изложенных идей и результатов на реальной статистической задаче, где можно было бы на реальных данных проверить эффективность предлагаемого подхода. Одно из приложений представлено в [3,4].

Литература:

1.                 В. Н. Тутубалин. Теория вероятностей — краткий курс и научно-методические замечания. Издательство МГУ, 1972.

2.                 Д. А. Молодцов. Теория мягких множеств. Издательство УРСС, 2004.

3.                 Д. А. Молодцов. Управление портфелем с использованием мягкой вероятности. Вестник НАУФОР, № 7–8, 2007.

4.                 Д. А. Молодцов. Управление портфелем с использованием мягкой вероятности. (короткие позиции). Вестник НАУФОР, № 10, 2007.

5.                 Д. А. Молодцов. «Мягкие множества и прогнозирование» // Нечеткие системы и мягкие вычисления. Том 6, № 1, июнь 2011.

6.                 Д. А. Молодцов. «Финитная устойчивость частот и вероятность» // Нечеткие системы и мягкие вычисления. Том 5, № 1, июнь 2010.

7.                 Д. А. Молодцов. «Мягкая неопределенность и вероятность» // Нечеткие системы и мягкие вычисления. Том 3, № 1, март 2008.



[1] Работа выполнена при финансовой поддержке РФФИ, грант № 11-01-00781-а

Основные термины (генерируются автоматически): случайная функция, приближенное среднее, мягкая вероятность, статистическая регулярность, приближенная дисперсия, база данных, выборка, любой, неравенство, статистическая база данных.