Проблемы применения статистических критериев проверки гипотез к анализу экспериментальных данных социально-психологических исследований | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 23 ноября, печатный экземпляр отправим 27 ноября.

Опубликовать статью в журнале

Автор:

Рубрика: Математика

Опубликовано в Молодой учёный №7 (87) апрель-1 2015 г.

Дата публикации: 03.04.2015

Статья просмотрена: 590 раз

Библиографическое описание:

Парыгина, С. А. Проблемы применения статистических критериев проверки гипотез к анализу экспериментальных данных социально-психологических исследований / С. А. Парыгина. — Текст : непосредственный // Молодой ученый. — 2015. — № 7 (87). — С. 11-14. — URL: https://moluch.ru/archive/87/16985/ (дата обращения: 15.11.2024).

В статье рассматриваются вопросы, связанные с особенностями применения статистических критериев проверки гипотез к обработке экспериментальных данных больших объемов, в частности, к обработке данных социологических исследований. Приводятся особенности реализации и сравнительная характеристика параметрических и непараметрических критериев проверки гипотез.

Ключевые слова:выборка, генеральная совокупность, статистические критерии проверки гипотез, параметрические и непараметрические критерии.

 

Одной из важнейших задач математической статистики на сегодняшний день является разработка и применение эффективных методов анализа статистических данных, полученных в разных областях деятельности человека. Но существует ряд особенностей применения методов математической статистики для обработки данных социально-психологических исследований. Во-первых, значительное количество измерений случайных величин, характеризующих те или иные стороны социально-психологических явлений и процессов производится в номинальной и порядковой шкалах, где затруднено применение многих параметрических методов. Во-вторых, часто, особенно в социологии, необходимо провести статистическую обработку данных очень больших объемов. И, в-третьих, почти всегда неизвестны и не могут быть установлены с помощью качественного анализа типы вероятностных законов распределения упомянутых выше случайных величин.

Указанные особенности не позволяют исследователям применять в своей работе методы математической статистики по аналогии с тем, как эти методы применяются в естественных или технических науках.

Непараметрические методы расширяют область приложения статистических методов в социально-психологических науках по сравнению с классическими параметрическими методами, так как «…не предназначены специально для какого-нибудь параметрического семейства распределений и не используют его свойства» [5, с.6].

В основе любого непараметрического критерия лежит определенная непараметрическая статистика.

Рассмотрим выборочный вектор х=(x1,...,xn) из генеральной совокупности, характеризуемой случайной величиной Х=(X1,…,Xn). Пусть F0 — функция распределения случайной величины Х.

Определение 1. Статистика S(Х) называется непараметрической, если распределение S(Х) не зависит от F0 [1, с.70].

В целях обобщения и систематизации непараметрических критериев проверки гипотез рассмотрим классификацию непараметрических статистик, в основу которой положен способ вычисления этих статистик.

Все непараметрические статистики можно разделить на две группы:

1.                  ранговые непараметрические статистики;

2.                  неранговые непараметрические статистики.

Первую группу «Ранговые непараметрические статистики» мы разделяем ещё на две подгруппы:

1.1.            непараметрические статистики, основанные на эмпирических функциях распределения;

1.2.            собственно ранговые непараметрические статистики.

Рассмотрим более подробно первую группу методов — «Ранговые непараметрические статистики». Вычисление статистик данной группы базируется на понятии ранга, поэтому введем соответствующие определения.

Определение 2. Пусть оi(x) есть значение i-й по величине координаты вектора x=(x1,…,xn), так что o1(x) — наименьшее значение, on(x) — наибольшее. Полагая x(i)=oi(x), имеем

x(1) ≤ x(2) ≤ …≤x(n).                                                                                                         (1)

Статистика X(i)=oi(Х) будет называться i-й порядковой статистикой, и вектор порядковых статистик (X(1),…,X(n)) будет кратко обозначаться X(.) [2, с.45].

Определение 3. Для вектора x=(x1,…,xn), у которого никакие две координаты не совпадают, обозначим ri(x) — число координат, не превосходящих xi, то есть номер xi в последовательности (1), тогда статистику

Ri=ri(Х), i=1, …, n

будем называть рангом элемента Xi. Вектор R=(R1,…,Rn) будет обозначать вектор рангов [2, с.45].

Очевидно, что по определению 3 числа ri(x) образуют перестановку порядка n.

Определение 4. Статистику Т, являющуюся функцией от R, T=t(R), будем называть ранговой статистикой [2, с.71].

Определение ранговых статистик в статье основано на существенном предположении, что все наблюдаемые случайные величины имеют непрерывные распределения. Однако случайные величины, наблюдаемые на практике всегда дискретны либо по своей природе (например, целочисленные величины), либо вследствие округления. Существуют способы специальной обработки экспериментальных данных так, чтобы можно было применить теорию ранговых статистик, например, рандомизация, усредненные статистики и метки, средние ранги и т. д.

Остановимся более подробно на группе методов, составляющих подгруппу 1.1 «Непараметрические статистики, основанные на эмпирических функциях распределения».

Определение 5. Статистики типа Колмогорова-Смирнова будем называть статистиками, основанными на эмпирических функциях распределения.

Подгруппа 1.1 включает в себя статистику Колмогорова, статистику Смирнова, Реньи, статистику Крамера-Мизеса и другие. Покажем на примере статистики Смирнова, что статистики этой подгруппы действительно являются ранговыми.

Определение 6. Пусть (d1,...,dn) — обратная перестановка по отношению к (r1,...,rn), то есть

Пусть D = (D1,...,Dn) обратна в этом смысле к R=(R1,...,Rn), тогда статистики D1,...,Dn будем называть антирангами [2, с.77].

Пусть X1,...,Xm — первая выборка объема m; X1,...,Xn — вторая выборка объема n; D1,...,Dn+m — антиранги для объединенной выборки X1,...,Xn+m. Из определений 1 и 3 ясно, что Dk=j тогда и только тогда, когда X(k)=Xj. Обозначим F1,m(x) и F2,n(x) — эмпирические функции распределения для первой и второй выборок соответственно. Положим

Предложение 1. Статистику Смирнова

                                                               (2)

можно представить в виде:

где d — наибольший общий делитель n и m.

Доказательство приводится в [6, с.64].

На основе статистик данной подгруппы разработаны широко известные критерии проверки гипотез Колмогорова, Смирнова, Реньи, Крамера-Мизеса. В частности, критерий Колмогорова предназначен для проверки гипотез согласия. Критерии Смирнова, Реньи и Крамера-Мизеса предназначены для проверки гипотез однородности двух независимых выборок, причем как отмечают Я. Гаек и З. Шидак в [2] альтернативы могут быть как широкими, так и более узкими, например, о сдвиге функции плотности одной выборки относительно функции плотности другой или о различии параметров масштаба в двух выборках.

Наиболее широко в социально-психологических исследованиях используются критерии Колмогорова и Смирнова, в источнике [4] рекомендуется применять их для выявления различий в распределении исследуемых социально-психологических признаков при самых общих альтернативах. Но при этом следует учитывать некоторые особенности. В работе [3] авторы утверждают, что критерий Смирнова допускает использование данных, измеренных по шкале не ниже порядковой, однако для порядковых статистик таблицы точных критических значений составлены, в основном, для выборок небольшого объема, поэтому при выборках большого объема приходится пользоваться таблицами критических значений предельного распределения Колмогорова. Переход к предельному распределению возможен только в том случае, когда экспериментальные данные представляют измерения по шкале не ниже интервальной. Поэтому чаще всего в социально-психологических исследованиях применение критерия Смирнова возможно в случае оценки результатов социально-психологических экспериментов для двух независимых выборок при учете времени изучаемых реакций или числа верных (или неверных) ответов испытуемых на контрольные вопросы, так как эти измерения производятся по интервальной шкале.

Так как в процессе использования критерия Колмогорова для проверки гипотезы согласия в случае выборок большого объема также осуществляется переход к предельному распределению Колмогорова, то и для этого критерия верно вышесказанное замечание об использовании интервальной шкалы.

В работе [3, с.123–124] авторы сравнивают критерии Смирнова и χ2 для проверки гипотез однородности при самых общих альтернативах и приходят к выводу, что область применения критерия χ2 шире, так как он допускает использование данных, измеренных по шкале наименований, причем с любым числом категорий. В то же время, критерий Смирнова более чувствителен, позволяя в ряде случаев отклонять нулевую гипотезу при более низком уровне значимости, чем χ2. Других сравнений для методов данной группы не найдено.

Таким образом, проведенный анализ показал, что, основываясь на особенностях социально-психологических измерений, все непараметрические статистики можно разделить на 2 группы: ранговые и неранговые. Методы, основанные на статистиках группы «Ранговые непараметрические статистики» применимы к широкому кругу задач: проверка согласия, однородности, независимости, симметричности распределения выборок; оценка и определение доверительных интервалов для параметров сдвига и масштаба и т. д. Методы этой группы имеют высокую чувствительность, но область применения их в психологии ограничена порядковыми, а для первой подгруппы даже интервальными, данными.

Методы проверки гипотез группы «Неранговые непараметрические статистики» ещё предстоит исследовать, хотя круг задач этих методов более узок: в основном проверка согласия и однородности распределений выборок. С другой стороны, методы, основанные на ядерных оценках плотности, работают лишь с данными, измеренными по шкале интервалов или отношений, но они решают более сложные задачи, например, задачу распознавания образов в условиях неоднозначных указаний «учителя».

 

Литература:

 

1.         Боровков А. А. Математическая статистика. — Новосибирск: Наука. Изд-во Института математики, 1997.– 772 с.

2.         Гаек Я., Шидак З. Теория ранговых критериев. — М.: Наука, 1971.– 371с.

3.         Грабарь М. И., Краснянская К. А. Применение математической статистики в педагогических исследованиях. Непараметрические методы. — М.: Педагогика, 1977.-136 с.

4.         Сидоренко Е. В. Методы математической обработки в психологии.-СПб.: Соц.-пс. центр, 1996.-349 с.

5.         Холлендер М., Вулф Д. Непараметрические методы статистики/ Пер. с англ. Д. С. Шмерлинга; Науч. ред. Ю. П. Адлера, Ю. Н. Тюрина. — М.: Финансы и статистика, 1983.-518 с.

6.         Hajek J. Nonparametric Statistics. Holden-Day, San Francisco, 1969.

Основные термины (генерируются автоматически): статистик, критерий Смирнова, математическая статистика, предельное распределение, статистик Смирнова, эмпирическая функция распределения, генеральная совокупность, интервальная шкала, непараметрический критерий проверки гипотез, статистический критерий проверки гипотез.


Ключевые слова

выборка, генеральная совокупность, статистические критерии проверки гипотез, параметрические и непараметрические критерии., параметрические и непараметрические критерии

Похожие статьи

Управление качеством строительных технологий на основе обобщенного критерия качества

В работе предложен новый подход к описанию и оптимизации интегрального критерия качества выбранных свойств системы методами нелинейного программирования, где в качестве параметризации выбираются стоимостные характеристики. Приведены примеры постаново...

Значение следственной ситуации и ее характеристика по убийствам, совершаемым в условиях неочевидности

В статье рассмотрены теоретические основы ситуационного подхода к расследованию преступлений и разработке методических рекомендаций в рамках криминалистики. Определено понятие и прикладное значение следственных ситуаций, рассмотрена их классификация....

Модификация теории социального влияния Латане для компьютерных социальных сетей

Данная статья посвящена проблемам анализа межличностных отношений в компьютерных социальных сетях. Речь идет об использовании теории динамического социального влияния Латане на основе различных характеристик (количественных и структурных), понятий, м...

Квантово-механическая трактовка неопределенности измерений в метрологии

В статье приведено краткое сравнение понятий погрешности и неопределенности при оценке результата измерений. Рассмотрены философские аспекты процесса измерений как вероятностного эксперимента. Сформулированы предпосылки для описания теории неопределе...

Исследование точности и устойчивости критериальных стоимостных оценок строительных материалов к погрешностям во входных данных методами имитационного моделирования

В настоящей работе методами имитационного моделирования исследуется влияние входных погрешностей в начальных данных и естественных ограничениях по содержанию компонентов смесей на расчетные параметры оптимальных по свойству и стоимости составов сухих...

Синтез обобщенного критерия качества

Рассматривается разработка аддитивного обобщенного критерия качества на основе нормализованных безразмерных частных критериев, характеризующих отдельные свойства системы. Указываются приложения к оценке имитационных характеристик тренажеров транспорт...

Анализ ключевых показателей эффективности зарубежных промышленных предприятий: проблемы и направления развития

Основной целью статьи является демонстрация результатов анализа ключевых показателей эффективности зарубежных предприятий и компаний, относящихся к ведущим игрокам на рынках машиностроения, нефтегазовой и атомной отраслях, а также определение проблем...

Методика количественного анализа эффективности систем заводнения

В данной статье рассматривается разработка и применение методики количественного анализа для оценки эффективности систем заводнения нефтяных месторождений. Основное внимание уделяется анализу различных подходов к моделированию потоков пластовых флюид...

Методы оценки финансового состояния организации

В данной статье рассматривается понятие финансового состояния организации, а также его методы и подходы. Представлена авторская методика анализа, основанная на концепции Турманидзе Т. У., и составлена таблица порядка его проведения.

Направления совершенствования методики анализа и аудита материально-производственных запасов

В статье рассматриваются значение и роль материально-производственных запасов в деятельности предприятия. Предложены теоретические положения и практические рекомендаций по развитию методик анализа и аудита материально-производственных запасов на комм...

Похожие статьи

Управление качеством строительных технологий на основе обобщенного критерия качества

В работе предложен новый подход к описанию и оптимизации интегрального критерия качества выбранных свойств системы методами нелинейного программирования, где в качестве параметризации выбираются стоимостные характеристики. Приведены примеры постаново...

Значение следственной ситуации и ее характеристика по убийствам, совершаемым в условиях неочевидности

В статье рассмотрены теоретические основы ситуационного подхода к расследованию преступлений и разработке методических рекомендаций в рамках криминалистики. Определено понятие и прикладное значение следственных ситуаций, рассмотрена их классификация....

Модификация теории социального влияния Латане для компьютерных социальных сетей

Данная статья посвящена проблемам анализа межличностных отношений в компьютерных социальных сетях. Речь идет об использовании теории динамического социального влияния Латане на основе различных характеристик (количественных и структурных), понятий, м...

Квантово-механическая трактовка неопределенности измерений в метрологии

В статье приведено краткое сравнение понятий погрешности и неопределенности при оценке результата измерений. Рассмотрены философские аспекты процесса измерений как вероятностного эксперимента. Сформулированы предпосылки для описания теории неопределе...

Исследование точности и устойчивости критериальных стоимостных оценок строительных материалов к погрешностям во входных данных методами имитационного моделирования

В настоящей работе методами имитационного моделирования исследуется влияние входных погрешностей в начальных данных и естественных ограничениях по содержанию компонентов смесей на расчетные параметры оптимальных по свойству и стоимости составов сухих...

Синтез обобщенного критерия качества

Рассматривается разработка аддитивного обобщенного критерия качества на основе нормализованных безразмерных частных критериев, характеризующих отдельные свойства системы. Указываются приложения к оценке имитационных характеристик тренажеров транспорт...

Анализ ключевых показателей эффективности зарубежных промышленных предприятий: проблемы и направления развития

Основной целью статьи является демонстрация результатов анализа ключевых показателей эффективности зарубежных предприятий и компаний, относящихся к ведущим игрокам на рынках машиностроения, нефтегазовой и атомной отраслях, а также определение проблем...

Методика количественного анализа эффективности систем заводнения

В данной статье рассматривается разработка и применение методики количественного анализа для оценки эффективности систем заводнения нефтяных месторождений. Основное внимание уделяется анализу различных подходов к моделированию потоков пластовых флюид...

Методы оценки финансового состояния организации

В данной статье рассматривается понятие финансового состояния организации, а также его методы и подходы. Представлена авторская методика анализа, основанная на концепции Турманидзе Т. У., и составлена таблица порядка его проведения.

Направления совершенствования методики анализа и аудита материально-производственных запасов

В статье рассматриваются значение и роль материально-производственных запасов в деятельности предприятия. Предложены теоретические положения и практические рекомендаций по развитию методик анализа и аудита материально-производственных запасов на комм...

Задать вопрос