АНАЛИЗ НОМИНАТИВНЫХ ДАННЫХ
Методы, о которых пойдет речь в этой главе, касаются проверки, по-види- мому, самого широкого класса гипотез — в отношении тех явлений, измерения которых доступны в номинативной шкале.
ПРИМЕРЫ______________________________________________________________________
Кто чаще обращается в службу знакомств: мужчины или женщины?
Зависит ли количество аварий на производстве от дня недели?
Можно ли утверждать, что водители-женщины чаще становятся участниками ДТП
(дорожно-транспортных происшествий)?
Можно ли утверждать, что выигрыши в игре распределены не случайно среди проигрышей?
Данные для ответов на подобные обыденные и чисто академические вопросы могут быть получены при помощи простого способа — классификации событий и людей по интересующим градациям. И несмотря на, казалось бы, бесчисленное многообразие подобных ситуаций, все они могут быть сведены к трем типичным случаям:
1 — сравнение наблюдаемого (эмпирического) распределения частот с ожидаемым (теоретическим) распределением;
2 — сравнение двух или более наблюдаемых распределений частот;
3 — сравнение наблюдаемого распределения событий Xсреди событий У (серий X, У) со случайным распределением.
ПРИМЕРЫ______________________________________________________________________
Случай I.
1. Кто чаще обращается в службу знакомств: мужчины или женщины? Для ответа на этот вопрос необходимо: а) подсчитать количество женщин и мужчин, обратившихся в службу знакомств; б) воспользовавшись методом статистической проверки, сопоставить полученное эмпирическое соотношение мужчин и женщин с ожидаемым (теоретическим) равномерным распределением.
2. Зависит ли количество аварий на производстве от дня недели? Проверка этого предположения требует выполнения сходных действий: а) подсчитать количество аварий для каждогодня недели за достаточно длительный промежуток вре мени; б) воспользовавшись методом статистической проверки, сопоставить полученное эмпирическое распределение количества аварий по дням недели с ожидаемым (теоретическим) равномерным распределением.
Случай II.
1. Зависит ли предпочтение напитка (минеральная вода, сок, лимонад) от сезона (зима, весна, лето, осень)? Для проверки этого предположения необходимо для каждого респондента определить тип предпочитаемого напитка (первая номинативная переменная, 3 градации) и сезон опроса (вторая номинативная переменная — 4 градации).
2. Зависит ли предпочтение одного из пяти кандидатов на выборах от пола потенциального избирателя? Для проверки этого предположения необходимо для каждого респондента определить пол (первая номинативная переменная, 2 градации) и предпо- чи гаемого кандидата, одного из пяти (вторая номинативная переменная, 5 градаций).
3. Повлияла ли рекламная кампания на выбор респондентами одного из двух товаров? Это предположение требует опроса респондентов на предмет предпочтения одного из двух товаров дважды: до рекламной кампании (первая номинативная переменная, две градации) и после нее (вторая номинативная переменная, те же две градации).
Для решения подобных задач, связанных с анализом классификаций или таблиц сопряженности, оказывается достаточным применение одного и того же критерия — х2-Пирсона:
Хэ=Е(/>/т)2, а/ = (к-])(1-1), (9.1)
1 = 1 /т
где Р — количество ячеек таблицы распределения или сопряженности, содержащих эмпирические значения частот;/э,/т — эмпирическое и теоретическое значения частот для одной ячейки; к — число градаций сопоставляемых распределений; / — количество сопоставляемых распределений. Приведенная формула является общей для различных ситуаций, и в каждом случае ее применение обладает своей спецификой.
ПРИМЕРЫ_______________________________________________________________________
Случай III.
1. Является ли закономерным последовательный повтор выигрышей среди проигрышей в игре или это случайные совпадения?
2. В последовательности событий X и У является ли закономерным их чередование (X после У и наоборот)?
3. Наблюдается ли закономерность в чередовании быстрых и медленных реакций на некоторый стимул: имеют ли они тенденцию к группированию или после медленной реакции следует быстрая (и наоборот)?
Для решения задач такого типа необходимо упорядочить события во времени и подсчитать число серий. Серия — это последовательность однотип ных событий, непосредственно перед и после которой произошли события другого типа. Далее применяется критерий серий, позволяющий определить вероятность случайного появления наблюдаемого числа серий при условии хаотичного распределения событий береди событий У.
Очень часто при исследовании классификаций, сопряженности или последовательности нет необходимости в накоплении данных в привычных таблицах типа «объект-признак»: результаты наблюдений сразу заносят в таблицу распределения (сопряженности) или составляют последовательность. В этом случае нет необходимости в использовании специальных статистических программ, и все расчеты можно провести «вручную». Тем более что они не составляют особого труда.
АНАЛИЗ КЛАССИФИКАЦИИ: СРАВНЕНИЕ ЭМПИРИЧЕСКОГО И ТЕОРЕТИЧЕСКОГО
РАСПРЕДЕЛЕНИЙ
Две градации
Эта задача сводится к сравнению численности двух долей объектов (людей, событий и т. д.) в совокупности: обладающих и не обладающих некоторым свойством.
ПРИМЕР________________________________________________________________________
Мы можем сопоставлять долю мужчин, которым больше нравятся блондинки, с долей мужчин, которым больше нравятся девушки с темными волосами. Или сопоставлять доли голосующих «за» и «против» введения моратория на смертную казнь.
Обычно, сопоставляя доли, мы надеемся обнаружить различия их пропорции от некоторого ожидаемого соотношения. Соотношение численности групп, которое мы получаем в результате исследования, называется эмпирическим распределением. Ожидаемому соотношению соответствует теоретическое распределение. В качестве теоретического распределения чаще всего выступает равномерное распределение.
Изучая отношение людей к введению моратория на смертную казнь, мы надеемся, что численность группы голосующих «за» будет отличаться от численности группы голосующих «против», то есть распределение голосующих на две категории будет отличаться от равномерного распределения.
Формулировка проверяемой Н0: соотношение долей в генеральной совокупности не отличается от ожидаемого (теоретического) соотношения.
Исходные данные: определена принадлежность каждого испытуемого к одной из двух категорий номинативной переменной. Задано ожидаемое (теоретическое) соотношение численности категорий.
Эта гипотеза проверяется при помощи формулы 9.1 для критерия х2, где Р — 2 (сумма состоит из двух слагаемых), к — 2,1=2, каждая из двух эмпирических частот соответствует численности сравниваемых групп. Численности каждой из сравниваемых групп (эмпирической частоте) ставится в соответствие теоретическая частота. Сумма теоретических частот равна сумме эмпирических частот, а соотношение теоретических частот равно ожидаемому (теоретическому) соотношению.
Следует отметить, что точное решение для такого рода задач дает применение биномиального критерия. Но поскольку его расчет трудоемок, а таблицы критических значений громоздки, мы предлагаем для расчетов «вручную» использовать приближение при помощи критерия %2. При расчетах на компьютере в подобных случаях все же следует предпочесть биномиальный критерий (см. раздел «Обработка на компьютере»),
ПРИМЕР 9.1_____________________________________________________________________
А) Из 50 опрошенных по поводу отношения к введению моратория на смертную казнь 30 были «за», 20 — «против» (предполагается, что выборка репрезентативна генеральной совокупности). Можно ли утверждать на основании этого опроса, что в совокупности количество сторонников превышает количество противников введения моратория на смертную казнь?
| Распределение:
| эмпирическое
| теоретическое
| «За»
|
|
| «Против»
|
|
| Сумма:
|
|
|
Шаг 1. Формулируем Н0: сравниваемые доли равны между собой (эмпирическое распределение соответствует равномерному распределению).
Ш а г 2. Выбираем для принятия статистического решения а = 0,05.
Ш а г 3. Вычисляем эмпирическое значение критерия. Задача сводится к сопоставлению эмпирического распределения 30:20 с идентичиым по общей численности, но равномерным теоретическим распределением 25:25. Следовательно:
(Гэ), = 30; = 20; = 25; <Д)2 = 25.
Подставляем эти значения в формулу 9.1:
Ш а г 4. Определяем ^-уровень. По таблице критических значений теоретического распределения х2-Пирсона (приложение 4) для с!/= 1 видим, что наше эмпирическое значение х2э находится левее критического значения для р = 0,1:
р > 0,1 р < 0,1 р< 0,05 р< 0,01 р<0,001
р = 0,1 р-0,05 р= 0,01 р =0,001
|
Ш а г 5. Принимаем статистическое решение. В соответствии со схемой определения р-уровня р > 0,1, и мы не можем отклонить Н0, так как р > а.
Ш а г 6. Формулируем содержательный вывод. В результате исследования не обнаружены статистически значимые различия в соотношении численности сторонников и противников введения моратория на смертную казнь (р > 0,1). Или: численность сторонников и противников введения моратория па смертную казнь статистически значимо не различается (/; >0,1).
Б) Предположим теперь, что было опрошено не 50, а 100 человек, и соотношение высказавшихся «за» и «против» сохранилось. Тогда эмпирические частоты составили бы 60 «за» и 40 «против», а соответствующие теоретические частоты равнялись бы 50. Число степеней свободы не меняется, а эмпирическое значение критерия увеличивается: = В соответствии с таблицей критических значений х2 и со схемой определения р-уропня/К 0,05, и мы можем отклонить Н0, так как р < а. Тогда содержательный вывод будет другим: численность сторонников введения моратория на смертную казнь статистически достоверно выше численности противников введения моратория (р < 0,05).
Обратите внимание: принятие Н0 не позволяет сделать никакого вывода о соотношении численности сравниваемых групп. Напротив, отклонение Н0 позволяет в данном случае говорить не только о различии сравниваемых долей, но и о направлении различий — о том, что одна доля больше другой.
Отметим, что в качестве ожидаемого (теоретического) распределения может выступать не обязательно равномерное распределение. Например, мы можем проверять содержательную гипотезу о том, что некоторая группа составляет по численности менее 20% совокупности. Тогда соотношение теоретических частот будет не 1:1, как в рассмотренном примере, а 1: 4. В остальном весь ход решения остается прежним.
ПРИМЕР 9.2_____________________________________________________________________
Рассмотрим исследование, в котором проводилось сравнение частоты рождения мальчиков в индейских семьях английского города, где подавляющую часть населения составляли выходцы из Америки[11]. Средняя частота рождения мальчиков в Англии составляет 52%, а в данном случае за период наблюдения из 20 родившихся детей мальчиков оказалось 5. Можно л и на этом основании сделать вывод о том, что в индейских семьях этого города мальчики рождаются достоверно реже, чем в целом по Англии?
Ш а г 1. Формулируем Н0: Р= 0,52 (выборочные данные согласуются с вероятностью рождения мальчиков Р- 0,52).
Ш а г 2. Выбираем для принятия статистического решения а = 0,05.
Ш а г 3. Составляем таблицу эмпирических и теоретических частот и вычисляем эмпирическое значение критерия.
| Распределения:
|
| эмпирическое
| теоретическое
| Мальчики
|
| 10,4
| Девочки
|
| 9,6
| Сумма:
|
|
|
Задача сводится к сопоставлению эмпирического распределения 5:15 с идентичным по общей численности теоретическим распределением (0,52:0,48). Следовательно:
(Л). = 5; (/э)2 = 15; (Л), = 10,4; (/т)2 = 9,6. Подставляем эти значения в формулу 9.1:
2 (5-10,4)2 , (15-9,б)2
X? =------------- +------ тт----- = 5,84 , й]~ .
10,4 9,6 У
Ш а г 4. Определяем/;-уровень. По таблице критических значений теоретического распределения %2-Пирсона (приложение 4) для 1 видим, что наше эмпирическое значение х2 находится между критическими значениями для р = 0,05 и р = 0,01. Следовательно, р < 0,05.
Ш а г 5. Принимаем статистическое решение. Так какр < а, то Н0 можно отклонить.
Ш а г 6. Формулируем содержательный вывод. В индейских семьях этого города мальчики действительно рождаются достоверно реже, чем в целом по Англии (р < 0,05).
Не нашли, что искали? Воспользуйтесь поиском по сайту:
©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.
|