Статистическое моделирование на ЭВМ дискретных случайных величин средствами языка программирования R
Автор: Дмитриев Игорь Александрович
Рубрика: 4. Информатика
Опубликовано в
XI международная научная конференция «Исследования молодых ученых» (Казань, июнь 2020)
Дата публикации: 01.06.2020
Статья просмотрена: 252 раза
Библиографическое описание:
Дмитриев, И. А. Статистическое моделирование на ЭВМ дискретных случайных величин средствами языка программирования R / И. А. Дмитриев. — Текст : непосредственный // Исследования молодых ученых : материалы XI Междунар. науч. конф. (г. Казань, июнь 2020 г.). — Казань : Молодой ученый, 2020. — С. 5-8. — URL: https://moluch.ru/conf/stud/archive/374/15897/ (дата обращения: 18.01.2025).
В статье рассматривается моделирование случайных величин, вычисление параметров случайных величин по выборке и изучение свойства состоятельности выборочных оценок средствами языка программирования «R».
Ключевые слова: моделирование, случайная величина, язык R.
Пользуясь средствами языка программирования «R«, рассмотрим процесс реализации на ЭВМ и исследования на точность алгоритма моделирования случайной величины, распределенной по геометрическому закону G(p):
(1)
где — заданный параметр распределения.
Дискретная случайная величина (ДСВ) ξ с геометрическим законом распределения есть число испытаний Бернулли до первого успеха (включая первый успех), если вероятность успеха в каждом испытании равна р [1, с. 22].
Метод моделирования ДСВ ξ с законом распределения G(p) основан на следующей теореме [2, c. 55]:
Теорема. Если R — биномиальная случайная величина (БСВ), то случайная величина
(2)
где [z] — целая часть z, имеет распределение (1).
Реализуем на языке программирования «R» моделирование n независимых случайных чисел, имеющих геометрическое распределение:
> n = 100; # количество независимых случайных чисел
> p = 0.5; # заданный параметр распределения
> eta = с( ); # вектор независимых случайных чисел
> geo = function(n, p) # функция для моделирования случайной величины
+ { R = runif(n);
+ for (i in 1:n) { eta[i] <- floor( log( R[i] ) / log( 1 - p ) ); }
+ return (eta);}
> ksi = geo(n,p); # моделирование случайной величины
Построим полигон относительных частот и полигон распределения
вероятностей при различных объемах выборок (n = 100, n = 1000, n = 10000). Для решения данной задачи используем следующий программный код:
> n1= table(ksi); # распределение частот случайных величин
> otn = n1/n; # распределение относительных частот
> plot(otn, "b", pch=19, col="red", xlab="Случайная величина",ylab="Относительная частота", lty=1); # графическое отображение
> x <- (min(ksi):max(ksi)); # вектор независимых случайных чисел
> y <- dgeom(x,p); # вектор теоретической плотности распределения
> lines(x,y,"b", pch=19,col="blue", lty=2);
Графические результаты приведены на рис. 1–3. На их основании можно утверждать, что с увеличением объёма выборки график полигона относительных частот стремится к полигону распределения вероятностей.
Аналогично с увеличением объема выборки, график эмпирической функции распределения также стремится к теоретической функции распределения. Графический результат для объёма выборки n = 10000 приведён на рис. 4.
Рис. 1. Графики полигона относительных частот и теоретического полигона распределения вероятностей, n=100
Рис. 2. Графики полигона относительных частот и теоретического полигона распределения вероятностей, n=1000
Рис. 3. Графики полигона относительных частот и теоретического полигона распределения вероятностей, n=10000
Рис. 4. Графики теоретической и эмпирической функции распределения, n=15000
Для построения графиков эмпирической и теоретической функций распределения используем следующий программный код:
> y1 <- pgeom(x,p); # вектор теоретической функции распределения
> plot(x, y1, col="black", xlab="Случайная величина", ylab="Функция распределения"); # графическое отображение
> for(i in (min(ksi):max(ksi)))
+ { y <- pgeom(i,p); lines(c(i,i+1),c(y,y),"l")}
> k <- 0; for (i in (min(ksi):max(ksi)))
+{x11<-c(i:(i+1)); k<-k+otn[i+1]; y11<-c(k,k); lines(x11,y11,col="blue");}
Будем использовать следующий программный код для вычисления теоретических и выборочных математического ожидания и дисперсии:
> vmo = mean(ksi); # выборочное мат. ожидание
> mteor = (1-p)/p; # теоретическое мат. ожидание
> vd = var(ksi); # выборочная дисперсия
> dteor = (1 - p) / ( p*p ); # теоретическая дисперсия
Чтобы убедиться в состоятельности выборочной оценки математического ожидания, реализуем средствами языка программирования «R» решение следующих задач: построить график стремления выборочной оценки параметра распределения к параметру распределения по вероятности с увеличением объема выборки n; построить линию параметра; построить доверительные границы, используя неравенство Чебышева. Реализацию решения выполняет следующий программный код:
> mx<-c(); for (j in (1:n)) { mx[j]=mean(rgeom(j,p)); }
> plot((1:n), mx, 'l', xlab='n', ylab='выборочное среднее');
> a1=c(1,n);b1=c(mteor, mteor); lines(a1,b1, col='red');
>pu=mteor+sqrt((1-p)/((1:n)*(p*p)*(1-0.95))); lines((1:n), pu, col='green');
>pu=mteor-sqrt((1-p)/((1:n)*(p*p)*(1-0.95))); lines((1:n), pu, col='green');
Графический результат для объёма выборки n = 15000 приведён на рис. 5. На его основании можно утверждать, что с увеличением объёма выборки выборочная оценка математического ожидания стремится по вероятности к теоретическому математическому ожиданию распределения.
Для реализации решения задачи статистического моделирования на ЭВМ дискретных случайных величин средствами языка программирования «R» на примере геометрического распределения были использованы следующие встроенные функции языка:
– runif(n) — моделирование n равномерно распределенных случайных величин от 0 до 1;
– floor(x) — служит для возврата целой части числа x;
– log(x) — вычисление натурального логарифма числа x;
– sqrt(x) — вычисление квадратного корня числа x;
– mean(x) — вычисление математического ожидания вектора х;
– var(x) — вычисление дисперсии вектора x;
– dgeom(x,p) — вычисление теоретической плотности распределения;
– pgeom(x,p) — вычисление теоретической функции распределения;
– rgeom(n,p) — моделирование n независимых случайных величин, распределенных по геометрическому закону.
Рис. 5. График сходимости выборочной оценки к параметру распределения, n=15000.
Литература:
- Лобач В. И. Имитационное и статистическое моделирование: Практикум для студентов мат. и экон. спец. / В. И. Лобач, В. П. Кирлица, В. И. Малюгин, С. Н. Сталевская. — Минск: БГУ, 2004. — 189 с.
- Харин Ю. С., Степанова М. Д. Практикум на ЭВМ по математической статистике. — Минск: Университетское, 1987. — 304 с.
- Хастингс Н., Пикок Дж. Справочник по статистическим распределениям. — М.: Статистика, 1980. — 95 с.
Похожие статьи
Статистическое моделирование на ЭВМ непрерывных случайных величин средствами языка программирования R
В статье рассматривается моделирование непрерывных случайных величин, вычисление параметров случайных величин по выборке, изучение свойства состоятельности выборочных оценок средствами языка программирования R.
Сравнение точности методов численного интегрирования на примере элементарных функций
В статье авторы проводят вычислительный эксперимент, посредством которого производится сравнение возможностей различных методов численного интегрирования на примере элементарной функции.
Описание нестационарных случайных процессов с помощью модели с переменными параметрами
В настоящей статье представлен алгоритм моделирования неоднородных случайных процессов, основанный на применении моделей с изменяющимися параметрами. При этом внимание уделяется моделям на основе базового набора возможных значений корреляционных пара...
Использование в педагогическом исследовании математических методов установления зависимостей
В статье исследуются математические методы установления зависимостей в различных педагогических исследованиях. В частности, рассматриваются методы установления количественных зависимостей, вычисления элементарных статистик и методы статистического вы...
Применение различных подходов к решению задач теории вероятностей при подготовке к экзаменам
Существуют различные методы решения задач теории вероятностей. Решение задач при помощи стандартных формул теории вероятностей (формулы сложения/умножения вероятностей/условной вероятности/ Байеса/ полной или не полной вероятности), решение методом п...
Разработка алгоритма быстрого преобразования Фурье на базе модели акторов
В данной работе авторами представлен параллельный алгоритм быстрого преобразования Фурье, универсальным примитивом выполнения вычислений которого является семейство акторов.
Метод желаемой логарифмической частотной характеристики для синтеза регулятора в системе управления
В статье рассматривается метод синтеза регулятора для заданного объекта управления, и его моделирование с помощью встроенных приложений в MATLAB.
Математическое моделирование задачи синтеза интегрированной системы безопасности с применением экспертных оценок
В работе рассматривается формализация проблемы синтеза интегрированной системы безопасности в виде задачи целочисленного программирования с использованием метода экспертных оценок для определения вычислительных параметров.
Программная реализация метода оценки погрешностей результатов картирования в рамках сплайн-аппроксимационного подхода
В настоящей работе рассматриваются ключевые особенности и достоинства сплайн-аппроксимационного подхода к построению карт, описывается способ оценки влияния погрешностей в исходных данных на результаты картопостроения. Приводятся результаты вычислите...
Моделирование комбинаторных систем при помощи сводимости
Статья посвящена моделированию систем, ее реализации в компьютере, в частности с использованием сводимости, в то же время рассматривается теория алгоритмов и возможность ее применения к моделированию.
Похожие статьи
Статистическое моделирование на ЭВМ непрерывных случайных величин средствами языка программирования R
В статье рассматривается моделирование непрерывных случайных величин, вычисление параметров случайных величин по выборке, изучение свойства состоятельности выборочных оценок средствами языка программирования R.
Сравнение точности методов численного интегрирования на примере элементарных функций
В статье авторы проводят вычислительный эксперимент, посредством которого производится сравнение возможностей различных методов численного интегрирования на примере элементарной функции.
Описание нестационарных случайных процессов с помощью модели с переменными параметрами
В настоящей статье представлен алгоритм моделирования неоднородных случайных процессов, основанный на применении моделей с изменяющимися параметрами. При этом внимание уделяется моделям на основе базового набора возможных значений корреляционных пара...
Использование в педагогическом исследовании математических методов установления зависимостей
В статье исследуются математические методы установления зависимостей в различных педагогических исследованиях. В частности, рассматриваются методы установления количественных зависимостей, вычисления элементарных статистик и методы статистического вы...
Применение различных подходов к решению задач теории вероятностей при подготовке к экзаменам
Существуют различные методы решения задач теории вероятностей. Решение задач при помощи стандартных формул теории вероятностей (формулы сложения/умножения вероятностей/условной вероятности/ Байеса/ полной или не полной вероятности), решение методом п...
Разработка алгоритма быстрого преобразования Фурье на базе модели акторов
В данной работе авторами представлен параллельный алгоритм быстрого преобразования Фурье, универсальным примитивом выполнения вычислений которого является семейство акторов.
Метод желаемой логарифмической частотной характеристики для синтеза регулятора в системе управления
В статье рассматривается метод синтеза регулятора для заданного объекта управления, и его моделирование с помощью встроенных приложений в MATLAB.
Математическое моделирование задачи синтеза интегрированной системы безопасности с применением экспертных оценок
В работе рассматривается формализация проблемы синтеза интегрированной системы безопасности в виде задачи целочисленного программирования с использованием метода экспертных оценок для определения вычислительных параметров.
Программная реализация метода оценки погрешностей результатов картирования в рамках сплайн-аппроксимационного подхода
В настоящей работе рассматриваются ключевые особенности и достоинства сплайн-аппроксимационного подхода к построению карт, описывается способ оценки влияния погрешностей в исходных данных на результаты картопостроения. Приводятся результаты вычислите...
Моделирование комбинаторных систем при помощи сводимости
Статья посвящена моделированию систем, ее реализации в компьютере, в частности с использованием сводимости, в то же время рассматривается теория алгоритмов и возможность ее применения к моделированию.