Основы математической статистики
Законы теории вероятностей — это математическое выражение реальных закономерностей, которым подчиняются массовые случайные явления. Каждое исследование случайных явлений, выполняемое методами теории вероятностей, прямо или косвенно опирается на экспериментальные данные, на результаты испытаний и наблюдений. Однако детально обследовать все множество интересующих нас объектов по некоторому признаку зачастую невозможно.
Разработка методов исследования массовых случайных явлений на основе анализа экспериментальных данных, полученных при обследовании сравнительно небольшой группы этих явлений, составляет предмет специальной науки — математической статистики.
Предмет и задачи математической статистики. Генеральная и выборочная совокупность
Фундаментальными понятиями математической статистики являются генеральная совокупность и выборочная совокупность (выборка).
Генеральная совокупность — это множество однородных объектов, подлежащих статистическому исследованию и характеризующихся определенными качественными или количественными признаками. Изучение всех объектов этой совокупности часто невозможно или нецелесообразно по физическим или экономическим причинам.
Например, реально существующая генеральная совокупность — это конкретно выбранная большая популяция людей: все жители Беларуси в данный момент времени или только все мужчины, или женщины, или дети.
Для того чтобы изучить генеральную совокупность по какому-либо из ее количественных признаков X (например, острота зрения, показатели анализа крови и т.д.), следовало бы изучить все ее объекты по этому признаку и затем обработать полученный массив данных методами теории вероятностей. Однако на практике провести подобное сплошное обследование объектов генеральной совокупности часто физически невозможно и экономически невыгодно. Главная цель данного исследования состоит в установлении закона распределения признака в генеральной совокупности и определении основных количественных характеристик этого распределения. Например, если будет установлено, что изучаемый признак распределен по нормальному закону, то достаточно определить два параметра распределения: его математическое ожидание и дисперсию, чтобы иметь полное представление о распределении этого признака в генеральной совокупности [см. формулу (3.14)]. Для нахождения закона распределения и его основных числовых характеристик достаточно исследовать только часть объектов генеральной совокупности, так называемую выборку.
Совокупность п объектов, отобранных из интересующей нас генеральной совокупности для конкретного статистического исследования, называется выборочной совокупностью или выборкой.
Исследование выборки дает некоторые приближенные оценочные значения интересующих нас параметров распределения, которые принимают различные значения для разных выборок. Главная цель выборочного метода, основного в математической статистике, — по вычисленным числовым характеристикам выборки как можно точнее определить соответствующие характеристики генеральной совокупности. Это возможно лишь в том случае, если отобранная для работы часть объектов обладает теми же основными свойствами, что и целое. Иначе говоря, выборка должна быть представительной {репрезентативной), т.е. по возможности полнее «представлять» свойства генеральной совокупности. Это одно из важнейших требований, предъявляемых к выборке, его несоблюдение ведет к грубым ошибкам и обесценивает результаты статистического исследования.
Например, если при изучении заболеваемости населения республики (генеральная совокупность) ишемической болезнью сердца в качестве выборки взята группа студентов, то результаты будут ошибочны, поскольку свойства такой выборки не соответствуют свойствам генеральной совокупности, как и в случае, если в качестве выборки будут взяты только пациенты кардиологического диспансера. Репрезентативность выборки обеспечивается ее достаточным объемом и определенными правилами ее формирования, которые в данном учебнике рассматриваться не будут.
Из многих задач, решаемых математической статистикой, выделим следующие:
- 1. Выяснение закона распределения исследуемого признака в выборке.
- 2. Определение числовых характеристик выборки (методы описательной статистики).
- 3. Оценка параметров генеральной совокупности по числовым характеристикам выборки: точечные оценки и доверительные интервалы для параметров распределения.
- 4. Исследование статистической связи между двумя признаками выборочной совокупности (элементы корреляционного анализа).