Статистическое моделирование на ЭВМ дискретных случайных величин средствами языка программирования R | Статья в сборнике международной научной конференции

Отправьте статью сегодня! Журнал выйдет 28 декабря, печатный экземпляр отправим 1 января.

Опубликовать статью в журнале

Автор:

Рубрика: 4. Информатика

Опубликовано в

XI международная научная конференция «Исследования молодых ученых» (Казань, июнь 2020)

Дата публикации: 01.06.2020

Статья просмотрена: 252 раза

Библиографическое описание:

Дмитриев, И. А. Статистическое моделирование на ЭВМ дискретных случайных величин средствами языка программирования R / И. А. Дмитриев. — Текст : непосредственный // Исследования молодых ученых : материалы XI Междунар. науч. конф. (г. Казань, июнь 2020 г.). — Казань : Молодой ученый, 2020. — С. 5-8. — URL: https://moluch.ru/conf/stud/archive/374/15897/ (дата обращения: 19.12.2024).



В статье рассматривается моделирование случайных величин, вычисление параметров случайных величин по выборке и изучение свойства состоятельности выборочных оценок средствами языка программирования «R».

Ключевые слова: моделирование, случайная величина, язык R.

Пользуясь средствами языка программирования «R«, рассмотрим процесс реализации на ЭВМ и исследования на точность алгоритма моделирования случайной величины, распределенной по геометрическому закону G(p):

(1)

где — заданный параметр распределения.

Дискретная случайная величина (ДСВ) ξ с геометрическим законом распределения есть число испытаний Бернулли до первого успеха (включая первый успех), если вероятность успеха в каждом испытании равна р [1, с. 22].

Метод моделирования ДСВ ξ с законом распределения G(p) основан на следующей теореме [2, c. 55]:

Теорема. Если R — биномиальная случайная величина (БСВ), то случайная величина

(2)

где [z] — целая часть z, имеет распределение (1).

Реализуем на языке программирования «R» моделирование n независимых случайных чисел, имеющих геометрическое распределение:

> n = 100; # количество независимых случайных чисел

> p = 0.5; # заданный параметр распределения

> eta = с( ); # вектор независимых случайных чисел

> geo = function(n, p) # функция для моделирования случайной величины

+ { R = runif(n);

+ for (i in 1:n) { eta[i] <- floor( log( R[i] ) / log( 1 - p ) ); }

+ return (eta);}

> ksi = geo(n,p); # моделирование случайной величины

Построим полигон относительных частот и полигон распределения

вероятностей при различных объемах выборок (n = 100, n = 1000, n = 10000). Для решения данной задачи используем следующий программный код:

> n1= table(ksi); # распределение частот случайных величин

> otn = n1/n; # распределение относительных частот

> plot(otn, "b", pch=19, col="red", xlab="Случайная величина",ylab="Относительная частота", lty=1); # графическое отображение

> x <- (min(ksi):max(ksi)); # вектор независимых случайных чисел

> y <- dgeom(x,p); # вектор теоретической плотности распределения

> lines(x,y,"b", pch=19,col="blue", lty=2);

Графические результаты приведены на рис. 1–3. На их основании можно утверждать, что с увеличением объёма выборки график полигона относительных частот стремится к полигону распределения вероятностей.

Аналогично с увеличением объема выборки, график эмпирической функции распределения также стремится к теоретической функции распределения. Графический результат для объёма выборки n = 10000 приведён на рис. 4.

Рис. 1. Графики полигона относительных частот и теоретического полигона распределения вероятностей, n=100

Рис. 2. Графики полигона относительных частот и теоретического полигона распределения вероятностей, n=1000

Рис. 3. Графики полигона относительных частот и теоретического полигона распределения вероятностей, n=10000

Рис. 4. Графики теоретической и эмпирической функции распределения, n=15000

Для построения графиков эмпирической и теоретической функций распределения используем следующий программный код:

> y1 <- pgeom(x,p); # вектор теоретической функции распределения

> plot(x, y1, col="black", xlab="Случайная величина", ylab="Функция распределения"); # графическое отображение

> for(i in (min(ksi):max(ksi)))

+ { y <- pgeom(i,p); lines(c(i,i+1),c(y,y),"l")}

> k <- 0; for (i in (min(ksi):max(ksi)))

+{x11<-c(i:(i+1)); k<-k+otn[i+1]; y11<-c(k,k); lines(x11,y11,col="blue");}

Будем использовать следующий программный код для вычисления теоретических и выборочных математического ожидания и дисперсии:

> vmo = mean(ksi); # выборочное мат. ожидание

> mteor = (1-p)/p; # теоретическое мат. ожидание

> vd = var(ksi); # выборочная дисперсия

> dteor = (1 - p) / ( p*p ); # теоретическая дисперсия

Чтобы убедиться в состоятельности выборочной оценки математического ожидания, реализуем средствами языка программирования «R» решение следующих задач: построить график стремления выборочной оценки параметра распределения к параметру распределения по вероятности с увеличением объема выборки n; построить линию параметра; построить доверительные границы, используя неравенство Чебышева. Реализацию решения выполняет следующий программный код:

> mx<-c(); for (j in (1:n)) { mx[j]=mean(rgeom(j,p)); }

> plot((1:n), mx, 'l', xlab='n', ylab='выборочное среднее');

> a1=c(1,n);b1=c(mteor, mteor); lines(a1,b1, col='red');

>pu=mteor+sqrt((1-p)/((1:n)*(p*p)*(1-0.95))); lines((1:n), pu, col='green');

>pu=mteor-sqrt((1-p)/((1:n)*(p*p)*(1-0.95))); lines((1:n), pu, col='green');

Графический результат для объёма выборки n = 15000 приведён на рис. 5. На его основании можно утверждать, что с увеличением объёма выборки выборочная оценка математического ожидания стремится по вероятности к теоретическому математическому ожиданию распределения.

Для реализации решения задачи статистического моделирования на ЭВМ дискретных случайных величин средствами языка программирования «R» на примере геометрического распределения были использованы следующие встроенные функции языка:

runif(n) — моделирование n равномерно распределенных случайных величин от 0 до 1;

floor(x) — служит для возврата целой части числа x;

log(x) — вычисление натурального логарифма числа x;

sqrt(x) — вычисление квадратного корня числа x;

mean(x) — вычисление математического ожидания вектора х;

var(x) — вычисление дисперсии вектора x;

dgeom(x,p) — вычисление теоретической плотности распределения;

pgeom(x,p) — вычисление теоретической функции распределения;

rgeom(n,p) — моделирование n независимых случайных величин, распределенных по геометрическому закону.

Рис. 5. График сходимости выборочной оценки к параметру распределения, n=15000.

Литература:

  1. Лобач В. И. Имитационное и статистическое моделирование: Практикум для студентов мат. и экон. спец. / В. И. Лобач, В. П. Кирлица, В. И. Малюгин, С. Н. Сталевская. — Минск: БГУ, 2004. — 189 с.
  2. Харин Ю. С., Степанова М. Д. Практикум на ЭВМ по математической статистике. — Минск: Университетское, 1987. — 304 с.
  3. Хастингс Н., Пикок Дж. Справочник по статистическим распределениям. — М.: Статистика, 1980. — 95 с.
Основные термины (генерируются автоматически): Случайная величина, выборочная оценка, график полигона, программный код, теоретический полигон распределения вероятностей, язык программирования, графический результат, графическое отображение, математическое ожидание, теоретическая функция распределения.

Похожие статьи

Статистическое моделирование на ЭВМ непрерывных случайных величин средствами языка программирования R

В статье рассматривается моделирование непрерывных случайных величин, вычисление параметров случайных величин по выборке, изучение свойства состоятельности выборочных оценок средствами языка программирования R.

Сравнение точности методов численного интегрирования на примере элементарных функций

В статье авторы проводят вычислительный эксперимент, посредством которого производится сравнение возможностей различных методов численного интегрирования на примере элементарной функции.

Описание нестационарных случайных процессов с помощью модели с переменными параметрами

В настоящей статье представлен алгоритм моделирования неоднородных случайных процессов, основанный на применении моделей с изменяющимися параметрами. При этом внимание уделяется моделям на основе базового набора возможных значений корреляционных пара...

Использование в педагогическом исследовании математических методов установления зависимостей

В статье исследуются математические методы установления зависимостей в различных педагогических исследованиях. В частности, рассматриваются методы установления количественных зависимостей, вычисления элементарных статистик и методы статистического вы...

Применение различных подходов к решению задач теории вероятностей при подготовке к экзаменам

Существуют различные методы решения задач теории вероятностей. Решение задач при помощи стандартных формул теории вероятностей (формулы сложения/умножения вероятностей/условной вероятности/ Байеса/ полной или не полной вероятности), решение методом п...

Разработка алгоритма быстрого преобразования Фурье на базе модели акторов

В данной работе авторами представлен параллельный алгоритм быстрого преобразования Фурье, универсальным примитивом выполнения вычислений которого является семейство акторов.

Метод желаемой логарифмической частотной характеристики для синтеза регулятора в системе управления

В статье рассматривается метод синтеза регулятора для заданного объекта управления, и его моделирование с помощью встроенных приложений в MATLAB.

Математическое моделирование задачи синтеза интегрированной системы безопасности с применением экспертных оценок

В работе рассматривается формализация проблемы синтеза интегрированной системы безопасности в виде задачи целочисленного программирования с использованием метода экспертных оценок для определения вычислительных параметров.

Программная реализация метода оценки погрешностей результатов картирования в рамках сплайн-аппроксимационного подхода

В настоящей работе рассматриваются ключевые особенности и достоинства сплайн-аппроксимационного подхода к построению карт, описывается способ оценки влияния погрешностей в исходных данных на результаты картопостроения. Приводятся результаты вычислите...

Моделирование комбинаторных систем при помощи сводимости

Статья посвящена моделированию систем, ее реализации в компьютере, в частности с использованием сводимости, в то же время рассматривается теория алгоритмов и возможность ее применения к моделированию.

Похожие статьи

Статистическое моделирование на ЭВМ непрерывных случайных величин средствами языка программирования R

В статье рассматривается моделирование непрерывных случайных величин, вычисление параметров случайных величин по выборке, изучение свойства состоятельности выборочных оценок средствами языка программирования R.

Сравнение точности методов численного интегрирования на примере элементарных функций

В статье авторы проводят вычислительный эксперимент, посредством которого производится сравнение возможностей различных методов численного интегрирования на примере элементарной функции.

Описание нестационарных случайных процессов с помощью модели с переменными параметрами

В настоящей статье представлен алгоритм моделирования неоднородных случайных процессов, основанный на применении моделей с изменяющимися параметрами. При этом внимание уделяется моделям на основе базового набора возможных значений корреляционных пара...

Использование в педагогическом исследовании математических методов установления зависимостей

В статье исследуются математические методы установления зависимостей в различных педагогических исследованиях. В частности, рассматриваются методы установления количественных зависимостей, вычисления элементарных статистик и методы статистического вы...

Применение различных подходов к решению задач теории вероятностей при подготовке к экзаменам

Существуют различные методы решения задач теории вероятностей. Решение задач при помощи стандартных формул теории вероятностей (формулы сложения/умножения вероятностей/условной вероятности/ Байеса/ полной или не полной вероятности), решение методом п...

Разработка алгоритма быстрого преобразования Фурье на базе модели акторов

В данной работе авторами представлен параллельный алгоритм быстрого преобразования Фурье, универсальным примитивом выполнения вычислений которого является семейство акторов.

Метод желаемой логарифмической частотной характеристики для синтеза регулятора в системе управления

В статье рассматривается метод синтеза регулятора для заданного объекта управления, и его моделирование с помощью встроенных приложений в MATLAB.

Математическое моделирование задачи синтеза интегрированной системы безопасности с применением экспертных оценок

В работе рассматривается формализация проблемы синтеза интегрированной системы безопасности в виде задачи целочисленного программирования с использованием метода экспертных оценок для определения вычислительных параметров.

Программная реализация метода оценки погрешностей результатов картирования в рамках сплайн-аппроксимационного подхода

В настоящей работе рассматриваются ключевые особенности и достоинства сплайн-аппроксимационного подхода к построению карт, описывается способ оценки влияния погрешностей в исходных данных на результаты картопостроения. Приводятся результаты вычислите...

Моделирование комбинаторных систем при помощи сводимости

Статья посвящена моделированию систем, ее реализации в компьютере, в частности с использованием сводимости, в то же время рассматривается теория алгоритмов и возможность ее применения к моделированию.