Рассмотрено применение метода малых выборок для оценивания генеральных совокупностей по распространенному критерию Стьюдента. Указываются отличия при статистическом оценивании выборок малого объема методами нормального распределения и t-распределения.
Рассмотрены конкретные примеры применения шаблонов Excel при анализе реальных результатов измерений резисторов по номинальному значению сопротивления и их преимущества перед ручным счетом при принятии решений о годности контролируемых объектов.
Ключевые слова: генеральная совокупность, малая выборка, критерий Стьюдента, нормальное распределение, шаблоны Excel.
В результате различных экспериментов исследователи получают данные, которые группируют в статистические ряды. Первым этапом исследования статистических рядов является ответ на вопрос, к какому виду распределения относятся полученные результаты. В зависимости от предполагаемого вида распределения производится вычисление основных статистических характеристик: средней арифметической величины (математического ожидания), дисперсии, среднего квадратического отклонения. Идеальным экспериментом является изучение совокупности всех объектов для решения поставленной задачи, то есть генеральной совокупности. В действительности число членов такой совокупности может быть бесконечно большим, поэтому на практике изучают выборочные совокупности, а затем на этой основе делают выводы об изучаемой генеральной совокупности.
В этом случае необходимо ответить на вопрос, насколько параметры данной выборки соответствуют параметрам генеральной совокупности, то есть, вычисляя параметры конкретной выборки, дать оценку соответствующих параметров генеральной совокупности. При определении доверительного интервала для генеральной средней в этом случае нужно пользоваться статистическими таблицами для нормального интеграла вероятностей. Если число членов в выборке мало (меньше 30), то возникает сомнение в возможности оценки по таким выборкам параметров генеральной совокупности. При формировании объема выборки можно придерживаться общего подхода, полагая, что она должна составлять 5–10 % (реже 15–25 %) от объема генеральной совокупности.
Принято считать, что начало статистике малых выборок или, как ее часто называют, статистике «малых n », было положено в 1908 г. публикацией работы сотрудника английской пивоваренной компании Уильяма Госсета, в которой он поместил t -распределение, постулированное получившим чуть позже мировую известность «студентом». Госсет опубликовал результаты своего эксперимента по сравнению выборочного контроля качества пива для проведения химического анализа с использованием t -распределения для малых выборок и традиционного z -распределения (нормального распределения) анонимно, под псевдонимом «Стьюдент» (Student). Рональд Фишер в дальнейшем использовал распределение в своих работах и дал ему название t -распределение Стьюдента, которое связывает между собой три основных характеристики выборочной совокупности: ширину доверительного интервала, соответствующую ему доверительную вероятность и объем выборки. В частности, на основе распределения Стьюдента можно получить надежную оценку доверительного интервала для аттестованного значения образца для контроля.
Теория t -распределения, подобно теории z -распределения, используется для проверки нулевой гипотезы о том, что две выборки представляют собой просто случайные выборки из одной генеральной совокупности и, следовательно, вычисленные статистики (например, среднее и стандартное отклонение) являются несмещенными оценками параметров генеральной совокупности. Однако, в отличие от теории нормального распределения, теория t -распределения для малых выборок не требует априорного знания или точных оценок математического ожидания и дисперсии генеральной совокупности. Более того, хотя проверка различия между средними двух больших выборок на статистическую значимость требует принципиального допущения о нормальном распределении характеристик генеральной совокупности, теория t -распределения не требует допущений относительно параметров.
Если случайная величина
Х
распределена по закону
Распределение случайной величины
где
Распределение Стьюдента имеет среднее
Измерительная задача. Пусть количественный признак Х генеральной совокупности распределен нормально, причем среднее квадратическое отклонение


Из литературы [2, с. 190] известно, что по данным выборки можно построить случайную величину (её возможные значения принято обозначать через t):
которая имеет распределение Стьюдента с
Мы видим из уравнений (2) и (3), что распределение Стьюдента определяется параметром





определяется так [3, с. 217]
Заменив неравенство в круглых скобках равносильным ему двойным неравенством, получим [3, с.217, 4, с. 13]
Итак, пользуясь распределением Стьюдента, мы нашли доверительный интервал
покрывающий неизвестный параметр
Здесь случайные величины
Из литературы [5, с. 191] общеизвестно, что при неограниченном возрастании объема выборки
Однако важно подчеркнуть, что для малых выборок (
То обстоятельство, что распределение Стьюдента при малой выборке дает не вполне определенные результаты (широкий доверительный интервал), вовсе не свидетельствует о слабости метода Стьюдента, а объясняется тем, что малая выборка, разумеется, содержит малую информацию об интересующем нас признаке.
Степени свободы.
Число
В качестве примера использования распределения Стьюдента при выполнении лабораторных работ, связанных с измерением номинальных значений сопротивлений резисторов, представленных для контроля, рассмотрим обработку данных при помощи разработанного шаблона программного пакета Excel.
Реализация измерительной задачи. В работе производится оценка значений активного сопротивления в генеральной совокупности партий резисторов условным объемом N = 10000 шт. различных номинальных значений по результатам контроля малых выборок объемами n = 5, n = 10, n = 15, n = 25.
Исследованиям подвергались резисторы, приобретенные у ЗАО «ЧИП и ДИП», с номинальными значениями сопротивлений: R н = 3,9 кОм ± 10 %; R н = 27,0 кОм ± 5 %; R н = 220,0 кОм ± 5 %; R н = 330,0 кОм ± 10 %; R н = 150,0 кОм ± 5 %; R н = 51,0 кОм ± 5 %; R н = 750,0 кОм ± 5 %; R н = 2,0 МОм ± 5 %.
Учащиеся производили измерения и затем данные результатов измерений заносились в разработанный шаблон Excel с расчетными формулами для определения доверительных интервалов по критерию Стьюдента при доверительных вероятностях Р = 0,95 и 0,99. Шаблон позволяет произвести расчеты в автоматическом режиме, при этом исключаются ошибки счета, что нередко бывает при ручном методе расчета.
Измерения сопротивления резисторов производились цифровыми мультиметрами марки М-832 (рис. 1).
Рис. 1. Общий вид мультиметра М-832
При осуществлении расчетов использовались таблицы вида (см. рис. 2–8). Далее рассмотрен пример обработки данных при R н = 150,0 кОм ± 5 %.
На скриншотах показана последовательность действий в среде Excel на примере выборки n = 25.
Все действия с другими объемами выборок аналогичны рассмотренному объему n = 25 на рис. 2–8.
Рис. 2. Фрагмент диалогового окна с результатами измерений
Рис. 3. Определение среднего арифметического значения
Рис. 4. Определение дисперсии
Рис. 5. Определение среднего квадратического отклонения
Рис. 6. Определение средней квадратической погрешности среднего арифметического
Рис. 7. Определение доверительных границ погрешности результата измерений при доверительной вероятности Р = 0,95
Рис. 8. Определение доверительных границ погрешности результата измерений при доверительной вероятности Р = 0,99
Анализ приведенных на рис. 2–8 данных показал, что во всех случаях значение доверительных границ оказалось в пределах заданных в технических условиях допустимых значений и для других данных номиналов резисторов при доверительных вероятностях Р = 0,95 и Р = 0,99.
Одновременно оказалось, что распределение значений t отличается от нормального, тем сильнее, чем меньше n .
Поэтому и вероятность нахождения выборочных средних в пределах определенных значений
Для числа опытов n = 5 по таблицам Стьюдента t = 2,78. Доверительный интервал:
По мере увеличения n, t — распределение Стьюдента приближается к нормальному. При


Теперь нужно еще установить, что понимать под малой вероятностью. Ее выбор весьма произволен, но на основе опытов установили определенные границы, которые называются уровнями значимости. Вместо уровня значимости α используют иногда доверительную вероятность:
Чаще всего используются следующие уровни значимости: α = 5 % (Р = 95 %), α = 1 % (Р = 99 %) и α = 0,1 % ( Р = 99,9 %).
Отметим, что если расчетное значение статистики Стьюдента меньше или равно табличному значению критерия Стьюдента: t i ≤ t p , f , то результат считаем удовлетворительным. Если расчетное значение статистики Стьюдента больше табличного значения критерия Стьюдента: t i > t p , f , то результат считаем неудовлетворительным.
Право выбора величины доверительной вероятности в каждом отдельном случае остается за экспериментатором. На практике не бывает так, чтобы производственный вопрос решался только на основе результата статистического анализа. На первом месте должны всегда стоять практические соображения.
Применение t -критерия только тогда строго обосновано, когда выборка производится из нормально распределенной генеральной совокупности.
Если же распределение генеральной совокупности отличается от нормального, то распределение средних значений, вычисленных по выборкам небольшого объема, приближается к нормальному. Поэтому практически t -критерий применяется также в случае отличия распределения генеральной совокупности от нормального.
При достаточно большом объеме выборки доверительный интервал для математического ожидания равен
Если объем выборки небольшой, то в приведенной формуле доверительного интервала вместо z подставляют t , большее по величине, которое зависит не только от доверительной вероятности, но и от объема выборки n.
Объем выборки
n
можно вычислить исходя из определенной доверительной вероятности и точности доверительного интервала
Как видно из рассмотренных примеров и теоретических рассуждений, нахождение доверительных интервалов искомого параметра выходит за чисто статистические рамки и непосредственно переходит в область практической применимости статистических методов управления качеством конкретной продукции [6, с. 77–80]. Заметим, что ошибочное использование t ‐критерия Стьюдента увеличивает вероятность выявить несуществующие различия, т. е. подтвердить недостоверную гипотезу.
Выводы
- Рассмотрев применение метода малых выборок для оценивания генеральных совокупностей по распространенному критерию Стьюдента, авторы показали его действенность на практике. Это один важнейших статистических методов исследования, позволяющий сделать объективный вывод о сходстве или различии объектов анализа.
- Применение критериев Стьюдента при оценке генеральных совокупностей больших объемов методами малых выборок позволяет при обработке эмпирических данных принимать конкретные управленческие решения о качестве продукции, поступающей на входной контроль или находящейся на различных стадиях производства в технологическом процессе.
- Использование таких программных средств, как Excel, при обработке данных и получении конкретных результатов, исключает неизбежные ошибки ручного счета, повышает доверие пользователей к получаемым результатам, у обучающихся — повышает интерес к проводимым исследованиям, а также способствует повышению уровня их подготовки в области статистической обработки результатов измерений.
Литература:
- Сборник задач по математике для втузов. Специальные курсы. /Коллектив авторов: Э. А. Вуколов, А. В. Ефимов, В. Н. Земсков и др. / Под ред. А. В. Ефимова. — М.: Наука, 1984. — 608 с.
- Михок Г., Урсяну В. Выборочный метод и статистическое оценивание / Под ред. В. Ф. Матвеева. — М.: Финансы и статистика, 1982. — 245 с.
- Гмурман В. Е. Теория вероятностей и математическая статистика: Учеб. пособие для вузов / В. Е. Гмурман. — 9-е изд. стер. М.: Высш. школа, 2003. — 479 с.
- Иванов О. В. Статистика / Учебный курс для социологов и менеджеров. Часть 2. Доверительные интервалы. Проверка гипотез. Методы и их применение. — М.: Изд. МГУ им. М. В. Ломоносова, 2005. — 220 с.
- Сулицкий В. Н. Методы статистического анализа в управлении. Учеб. пособие — М.: Дело, 2002. — 520 с.
- Шиндовский Э., Шюрц О. Статистические методы управления качеством. Контрольные карты и планы контроля. / Пер. с нем. В. М. Ивановой и И. О. Решетниковой. — М.: Мир, 1976. — 597 с.