Интервальные оценки

Второй подход статистического оценивания состоит в использовании точечной оценки для определения множества значений, которое называется интервалом и по отношению к которому мы уверенно можем утверждать, что в нём содержится истинное, но неизвестное значение параметра. Нахождение этого интервала основано на вероятностном подходе, а сам он называется доверительным интервалом.

Вернемся к примеру успешности изучения студентами статистики. Пусть истинное значение среднего в генеральной совокупности ц= 68,0. Предположим, что случайным образом мы извлекли все возможные выборки с объемом п = 169 и вычислили выборочные средние для каждой из них. Известно, что 95% этих оценок должны лежать в диапазоне между 64 и 72, или отличаться не более чем на величину 1,96 стандартного отклонения с каждой стороны от ц.

  • 2.10. Оценивание параметра генеральной совокупности
  • 111

На рис. 12 видно, что 95 % всех выборочных средних лежит между (I -1,96% и и+1,96% (т.е. между 64,08 и 71,92, а в предыдущем параграфе эти значения были округлены до 64 и 72 соответственно, чтобы облегчить расчеты), в то же время 99 % выборочных средних попадают в интервал между р -2,58% и (1+2,58% (т.е. между 62,84 и 73,16).

Выборочное распределение среднего для гипотезы Н

Рис. 12. Выборочное распределение среднего для гипотезы Н0: р = 68, % = 2,0

Используя указанные свойства нормального распределения и стандартной ошибки среднего (s^), мы можем определить 95%-ный доверительный интервал (как правило, его обозначают сокращенно как 95% ДИ) для каждого возможного выборочного среднего по следующей формуле:

где х - выборочное среднее;

t - соответствующее f-значение, связанное с 95% ДИ, которое зависит от степеней свободы;

- стандартная ошибка среднего.

Для рассматриваемого примера у нас будет 168 степеней свободы и соответствующее it-значение равное 1,96. (Для степеней свободы k < 120 должны быть использованы соответствующие значения t-распределения из таблицы прил. 3, а не 1,96, которое есть значение для нормального распределения.) Соответствующий 95% доверительный интервал:

Предположим, что мы вычислили 95% ДИ и для остальных 29 средних, заданных в табл. 22. Мы отметим, что 2 из 30 доверительных интервалов не содержат точку 68,0, которая, по предположению, является средним генеральной совокупности. Это 95% ДИ для х = 63,9 и х = 72,1. Как мы уже отметили, если р = 68,0, то только 95% всех возможных выборочных средних будут расположены между 64,08 и 71,92. Соответственно, следует ожидать, что только в 95% случаев ДИ, построенные на основе соответствующих выборочных средних, будут содержать р = 68,0. Другими словами, у нас будет 95% -ная уверенность, в том, что (х ± 1,96s- ) содержит р, где х только одно из всех возможных выборочных средних.

Таблица 22

95% ДИ для 30 выборочных средних для Н(): р = 68 и sx = 2,0

Левая граница 95% ДИ

X

Правая граница 95% ДИ

63,38

67,3

71,22

61,88

65,8

69,72

67,68

71,6

75,52

66,88

70,8

74,72

65,48

69,4

73,32

62,88

66,8

70,72

64,28

68,2

72,12

67,78

71,1

75,62

Окончание табл. 22

Левая граница 95% ДИ

л:

Правая граница 95% ДИ

66,68

70,6

74,52

61,28

65,2

69,12

66,58

70,5

74,42

59,68

63,9*

67,82

64,58

68,5

74,42

67,18

71,1

75,02

62,58

66,5

70,42

63,88

67,8

71,72

66,68

70,6

74,52

62,18

66,1

70,02

67,48

71,4

75,32

64,68

68,6

75,52

66,88

70,8

74,72

63,88

67,9

71,82

66,48

70,4

74,32

67,68

71,6

75,52

62,38

66,3

70,22

68,18

72,1*

76,02

62,38

66,3

70,22

64,48

68,4

72,32

65,88

69,8

73,72

60,68

64,6

68,52

Примечание. * 95% ДИ не содержит истинного среднего генеральной совокупности.

Важно отметить следующее: мы не можем утверждать, что есть 95 % вероятности нахождения истинного, но неизвестного значения р в интервале [63,38; 71,22]. Это значение может быть в интервале, а может и не быть. Фактически вероятность относится ко всем возможным выборочным средним, по которым 95% ДИ был рассчитан. По этой причине данные интервалы называются доверительными, а не вероятностными. Подчеркнем этот момент: интерпретация доверительных интервалов производится в терминах доверия, т.е. мы предполагаем, что данный интервал должен содержать и. В нашем примере можно сделать вывод, что интервал [63,38; 71,22] содержит р с надежностью (доверием) в 95 % .

В приведенном выше примере мы использовали вероятностный уровень у = 0,95 в связке с концепцией доверительных интервалов. Этот вероятностный уровень принято называть уровнем доверия. На самом деле 0,95 = 1 - 0,05, где 0,05 - уровень значимости, или a-уровень, нулевой гипотезы. Как уже упоминалось, наиболее часто используемыми уровнями значимости являются 0,05 и 0,01. Это, соответственно, приводит к уровням доверия 0,95 и 0,99.

В социологии статистические оценки не применяются так широко, как проверка гипотез. Несмотря на это, статистическое оценивание является важным инструментом, потому что у него не существует ограничений, связанных с априорным определением параметра генеральной совокупности.

При проверке гипотеза о среднем х достижений студентов в изучении статистики нулевая гипотеза Н0: ц = 90) была отклонена, когда мы обнаружили, что выборочное среднее х = 67,3 значимо отличается от гипотетического (предполагаемого) значения генеральной совокупности. При отклонении гипотезы было сделано заключение, что вероятность того, что разность выборочного среднего х и среднего генеральной совокупности ц зависит от случайной флуктуации, очень низка и, следовательно, очень вероятно, что среднее генеральной совокупности отличается от 90. Этот вывод не дает оценку среднего генеральной совокупности. Чтобы получить такую оценку, нужно построить подходящий доверительный интервал.

В более общем плане отказ от нулевой гипотезы и принятие альтернативной не несет почти никакой информации об изучаемой переменной. Поэтому, проверяем ли мы гипотезу относительно параметра генеральной совокупности или нет, особого значения не имеет. Однако с прикладной точки зрения принципиально важно использование статистического оценивания, поскольку только через него мы можем получить новое знание об интересующем нас явлении и сказать, с какой степенью доверия можно относиться к полученному результату анализа и сделанным на его основе выводам.

Мы рассмотрели ключевые понятия и концепции статистического вывода: случайную выборку, вероятность и выборочное распределение. Статистический вывод основывается на том, что выборочные измерения, известные как статистики, отражают значения соответствующих параметров и, наряду с ними, случайные флуктуации. Мы кратко описали наиболее часто используемые выборочные модели. Все процедуры предполагают, что выборки случайны, т. е. они извлекается таким образом, что каждый элемент генеральной совокупности и любая комбинация элементов имеют ненулевой шанс быть извлеченными. Способ получения вероятностной выборки является важным для всех статистических процедур.

Понятие статистического вывода объединяет два процесса: оценку параметров и проверку гипотез. Эти два процесса образуют логическую процедуру индуктивного вывода относительно параметра генеральной совокупности, основанного на знании выборочной статистики. При проверке гипотез стратегия предполагает оценивание того, насколько предварительно установленное значение параметра является правдоподобным. Это предварительное значение не имеет прямого отношения к статистическому выводу и, как правило, получается на основе теоретических представлений и предварительного опыта в исследуемой области, что позволяет сформулировать нулевую гипотезу. Вычисление соответствующей статистики позволяет принять ее или отвергнуть, что в вероятностных терминах базируется на размерах разности между наблюдаемой статистикой и предполагаемым значением.

Когда невозможно логически задать значение параметра генеральной совокупности, процесс статистического вывода сводится к оценке параметра через статистику. Несмотря на то что стратегия оценивания параметра отличается от проверки гипотез, в основе обеих стратегий лежит одна и та же концепция. В частности, когда делается вывод о среднем генеральной совокупности, теоретическое выборочное распределение определяется на основе объема выборки и стандартного отклонения выборки. При проверке гипотезы относительно среднего генеральной совокупности гипотетическое (предполагаемое) значение ц используется в качестве среднего для выборочного распределения. С другой стороны, выборочное среднее используется, когда нужно найти доверительные интервалы.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >