Введение в статистический вывод: оценивание

КЛЮЧЕВЫЕ ТЕРМИНЫ: альтернативная гипотеза; базовое распределение; вероятность; вероятностная выборка; доверительный интервал; выбор с пропорциональной вероятностью; выборочное распределение; интервальное оценивание; кластерный (гнездовой) выбор; несмещенная оценка; уровень доверия; уровень значимости; нулевая гипотеза; проверка гипотез; простой случайный выбор; систематический выбор; стандартная ошибка среднего; степень свободы; стратифицированный выбор; теоретически выборочное распределение; точечное оценивание; ^-распределение Стьюдента; гипотеза; центральная предельная теорема.

Мы рассмотрели понятия описательной статистики. Это обобщенное название той части математической статистики, методы которой предназначены для описания данных в обобщенном виде таким образом, чтобы выявить распределение переменных и взаимосвязи между ними. При таком подходе обычно вычисляются среднее значение, стандартное отклонение, мода, медиана и т. д. для метрических переменных и частотное распределение - для неметрических. Эти описательные метрики были определены как параметры, и относились они к исследуемой генеральной совокупности.

Генеральная совокупность и выборка - это одни из наиболее часто встречающихся терминов при применении статистических методов. По определению генеральная совокупность включает в себя все объекты, которые могут быть предметом конкретного исследования. Например, все жители Ростовской области - генеральная совокупность.

Часто мы рассматриваем генеральную совокупность как большое количество элементов. Некоторые генеральные совокупности действительно таковы, но не все. Основное отличие одной генеральной совокупности от другой в том, что все ее элементы удовлетворяют правилу о принадлежности к данной генеральной совокупности. Этот термин используется и в более широком смысле: обозначает не только живые организмы (т.е. людей, животных и т.д.). Каждая генеральная совокупность должна определяться по составу, времени и месту. Генеральная совокупность может быть конечной (например, люди, живущие в данном регионе) или бесконечной.

Генеральную совокупность, содержащую более 10 000 членов, можно рассматривать как практически бесконечную. Кроме того, генеральная совокупность может быть реальной или гипотетической (скажем, дети, которые родятся в следующем году).

В большинстве ситуаций невозможно исследовать все элементы генеральной совокупности, поэтому рассматривается подмножество генеральной совокупности, представляющее собой выборочную совокупность, или выборку. В таком случае выборка является единственно возможным способом получить достоверные результаты о генеральной совокупности. Обычно выборка извлекается из генеральной совокупности в соответствии с заранее заданными критериями. Наиболее часто используют случайные выборки.

Качество выборки определяется тремя характеристиками: достоверностью, представительностью и объемом (количеством элементов).

Достоверность связана со степенью «истинности» собранной информации, т.е. она показывает, насколько верны ответы респондентов или результаты измерений. Организация деятельности по сбору информации из возможных источников и инструментарий для сбора информации не должны допускать искажений достоверности.

Представительность (репрезентативность) выборки связана с возможностью на основе ее анализа делать выводы, которые должны быть справедливы также и для всей генеральной совокупности (это является основной задачей статистических методов).

Объём выборки связан с точностью оценки параметров генеральной совокупности. Очевидно, что если выборка не воспроизводит структуру генеральной совокупности для изучения переменной, то выводы будут искажены. Чем меньше объём выборки, тем менее точна оценка генеральной совокупности.

Три характеристики не связаны непосредственно. Например, выборка с большим объемом может быть непредставительной, и высокая точность оценки будет невозможна, так как не ясно, как выборка соотносится с изучаемой генеральной совокупностью (по какому критерию она извлекалась).

Предположим, что нужно определить относительную долю детей (количество детей) в общем количестве жителей Ростова-на- Дону. Можно употребить аналогичный термин: относительная частота в составе генеральной совокупности - населения Ростова- на-Дону. Эта относительная доля часто называется мерой или

характеристикой генеральной совокупности. С другой стороны, предположим, что мы получили случайную выборку из числа ростовчан и определили относительную долю детей в этой выборке. Эта мера, или характеристика, выборки является статистикой.

Для обозначения характеристик генеральной совокупности и выборки используются, как правило, буквы греческого и латинского алфавитов: греческие и прописные латинские буквы означают характеристики, или параметры генеральной совокупности, а строчные латинские буквы обозначают соответствующую характеристику, или статистику выборки (табл. 20).

Таблица 20

Обозначения для выборки и генеральной совокупности

Наименование

характеристики

Генеральная совокупность (параметр)

Выборка

(статистика)

Среднее значение

Стандартное отклонение

Коэффициент корреляции

Объём совокупности

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >