СОДЕРЖАНИЕ И ОСНОВНЫЕ ЭТАПЫ МНОГОМЕРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА

Многие вещи нам непонятны не потому, что наши понятия слабы; но потому, что сии вещи не входят в круг наших понятий.

К. Прутков. Мысли и афоризмы

ЗАДАЧИ И МЕТОДЫ МНОГОМЕРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА

Многомерный статистический анализ (МСЛ) — раздел математической статистики, посвященный методам сбора, систематизации, обработки и интерпретации сложных совокупностей данных, нацеленный на выявление неявных (латентных) закономерностей в структуре и тенденциях развития исследуемых многомерных процессов.

Например, изучая экономическое поведение человека, мы можем судить о нем по заработной плате и образованию, но наши выводы будут полнее и точнее, если мы включим в анализ такие признаки, как социальное положение, состав семьи, уровень доходов семьи, состояние здоровья и др. Совместное изучение воздействия этих признаков на экономическое поведение позволит адекватно моделировать поведенческие реакции личности, коллектива.

Наиболее распространенными формами представления исходных статистических данных в МСА являются: а) матрица объект-свойство

где Х.р) — значениеу-го анализируемого признака, характеризующего состояние /-го объекта в момент времени t.

Например, пространственно-временная выборка, пространственная выборка при фиксированном /, временные ряды (п = 1);

б) матрица парных сравнений. Состоит из характеристик у попарных сравнений объектов по некоторому свойству:

Содержание многомерного статистического анализа состоит в решении следующих основных задач.

  • 1. Статистическое исследование зависимостей. Выявление и описание множественных статистических связей, существующих между признакамиX— (Xv Xv..., X). Используемые методы: корреляционный, регрессионный анализ, анализ временных рядов и др.
  • 2. Классификация объектов и признаков. Необходимо всю анализируемую совокупность объектов О,, ..., Оп, представленную в виде матриц (1.1) или (1.2), разбить на сравнительно небольшое число (известное заранее или нет) однородных в определенном смысле групп или классов. Исходными данными при классификации объектов являются строки матрицы (1.1), при классификации признаков — столбцы матрицы (1.1).

Методы: дискриминантный анализ, кластерный анализ и др.

3. Снижение размерности анализируемого признакового пространства.

Переход от исходного набора из р признаков к вспомогательному набору меньшего числа к признаков. Это необходимо при решении задач отбора наиболее информативных показателей, сжатия больших массивов информации, визуализации многомерных данных.

Методы: факторный анализ, метод главных компонент, многомерное шкалирование.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >