Распределение выборочного среднего, когда дисперсия генеральной совокупности неизвестна

Выше стандартное отклонение рассматривалось так, как если бы оно было тем же самым и на генеральной, и на выборочной совокупностях. Это в принципе верно, когда выборочная совокупность достаточно велика, и в таком случае мы вправе считать стандартное отклонение равным

где ц - среднее генеральной совокупности;

N - объём (количество элементов) генеральной совокупности.

Тем не менее следует иметь в виду, что всё же надежнее считать генеральное стандартное отклонение большим, нежели выборочное. Стандартное отклонение выборки, которое может быть использовано в качестве оценки стандартного отклонения генеральной совокупности, определяется следующим образом:

где х - выборочное среднее; п - объём выборки.

Так как стандартное отклонение генеральной совокупности неизвестно, то исправленное выборочное стандартное отклонение s используется в качестве оценки для генерального а, когда проверяются гипотезы о среднем генеральной совокупности или оценивается среднее генеральной совокупности через выборочное среднее.

Рассмотрим пример использования возможного истинного значения генеральной средней для социологической оценки воздействия фактора отнесения себя к определенной социально-экономической

  • 2.8. Проверка гипотез относительно среднего...
  • 89

страте на представление об экономической ситуации в России. Собранные данные в процентном выражении по строкам (что выравнивает наблюдаемые частоты) представлены в табл. 21.

Таблица 21

Оценка респондентами экономической ситуации в России в зависимости от принадлежности к социально-экономическим стратам

Оценка экономической ситуации в России

К какому слою населения Вы себя относите?

Итого

К высокообеспеченному: денег хватает на удовлетворение всех потребностей

К среднеобеспеченному: денег хватает на питание, жилье, одежду, образование, здоровье, отдых...

Низкообеспеченному: денег хватает в основном на питание, жилье, товары первой необходимости

Необеспеченному: денег не хватает даже на питание

Затрудняюсь ответить

Вполне благоприятная

13,8

62,1

20,7

0,0

3,4

100,0

Скорее благоприятная

7,3

65,9

17,1

0,8

8,9

100,0

Скорее неблагоприятная

6,5

68,9

19,4

2,2

3,1

100,0

Совершенно неблагоприятная

5,6

61,8

24,7

3,4

4,5

100,0

Затрудняюсь ответить

10,3

69,2

10,3

0,0

10,3

100,0

Среднее значение х.

8,70

65,58

18,44

1,28

6,04

Стандартное отклонение S

3,35

3,56

5,32

1,49

3,33

Средние значения xj приведены по столбцам, что позволяет с большей степенью объективности оценивать влияние переменной, принятой в качестве фактора, на основании логического анализа. По формуле (23) с учетом того, что п в данном случае - число градаций переменной «оценка экономической ситуации», находим границы интервала, в котором на генеральной совокупности может находиться истинное среднее значение ц.:

где xf - среднее значение по столбцам таблицы;

S - исправленное выборочное стандартное отклонение; п-в данном случае число градаций переменной «оценка экономической ситуации».

В границах этих интервалов будут лежать те значения х.., которые являются независимыми случайными величинами, т. е. могли быть получены в результате случайной отметки респондентами той или иной ответной позиции, и фактор принадлежности к социально-экономической страте нельзя считать для этих значений действующим на оценку экономической ситуации.

Между тем шкалы обеих переменных - порядковые, что делает необходимым применение для обнаружения наличия сопряженности коэффициента у (не путать с уровнем доверия у), который показывает связь переменных на уровне от 0,03 до 0,23 (ygk =0,132 + 1,96x0,051) с уровнем значимости а = 0,010. Интерпретировать это можно так: с вероятностью Р = 0,99 на генеральной совокупности между переменными будет наблюдаться связь в 13% случаев (от 3 до 23%). Это не очень много, и по этой причине можно делать вывод о преобладающей общей оценке экономической ситуации как слабо зависимой от принадлежности респондентов к той или иной социально-экономической страте (ответная позиция «скорее неблагоприятная»). Но так как нас, собственно говоря, интересуют те выбросы за границы интервала возможного значения генеральной средней, которые имеют положительное значение и которые имеет смысл анализировать как результат воздействия фактора на зависимую переменную, то проведем соответствующие расчеты для ц:

Соответствующие выбросы выделены в табл. 21 подчеркиванием. В результате становится очевидным, что пониженное значение коэффициента сопряженности у обусловлено значительной долей респондентов, принадлежащих к категории среднеобеспеченных, отметивших, помимо ответной позиции «скорее неблагоприятная», также и позицию «затрудняюсь ответить», иначе расположение ячеек с выбросами было бы почти диагональным и значительно более высоким. Кстати, положительное значение коэффициента сопряженности демонстрирует понижение оценки экономической ситуации вместе с понижением уровня обеспеченности респондентов.

Мы не проводили более глубокого социологического анализа табл. 21, ограничившись только иллюстрацией ключевых моментов применения метода определения генеральной средней при неизвестном стандартном отклонении (дисперсии) генеральной совокупности и возможностей извлечения информации из сопряженности переменных. При этом мы исходили все время из допущения, что распределение независимых случайных величин подчинено нормальному закону. Между тем нормальное распределение тесно связано с тремя другими видами распределения, которые часто используются при статистической обработке данных в социологии.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >