Статистический анализ аварий на нефтепроводах
Аварии вследствие коррозии. Низкая проницаемость почвы, пересечение сточных труб и улиц очень опасно:___
Переменная |
F |
Sig. |
Df |
Проницаемость почвы |
33.197 |
0.000 |
5 |
Литология |
39.420 |
0.000 |
3 |
Пересечение сточных труб |
3.461 |
0.063 |
1 |
Пересечение улиц |
3.074 |
0.080 |
1 |
Аварии вследствие внешней деятельности. Городская территория, малый диаметр труб, пересечение железных дорог и улиц очень опасно:
Переменная |
F |
__ |
Df |
Диаметр |
194.751 |
0.000 |
2964 |
Использование территории |
12.405 |
0.000 |
2964 |
Пересечение железных дорог |
78.003 |
0.000 |
2964 |
Пересечение улиц |
32.263 |
0.000 |
2964 |
Аварии вследствие механических отказов. Большой диаметр труб и вы-
сокое рабочее давление очень опасно:
Переменная |
F |
Sig. |
Df |
Диаметр |
13.974 |
0.000 |
1 |
Использование территории |
41.904 |
0.000 |
1 |
Статистические модели оценки риска
Для определения линейной комбинации количественных независимых переменных (или классифицирующих функций), наилучшим образом характеризующих различие между группами аварий с риском и без риска, можно использовать различные классифицирующие процедуры.
Эти результаты получены без обучающего множества.
Модель аварии |
Успешно классифицированные случаи |
Коррозия |
74% |
Сторонняя деятельность |
93% |
Механическая |
68% |
Были проведены несколько тестов с логистической регрессией, но улучшение не было значительным. Применение нейронных сетей для классификации причин аварий и разработки моделей оценки риска планируется в дальнейшем.
Дискриминационный анализ
Для решения проблемы дискриминационного анализа было проведено сравнение между различными статистическими методами. Методы, которые были сравнены по эффективности прогнозирования: линейный дискриминационный анализ, логистическая регрессия и нейронные сети.
Линейный дискриминационный анализ описан ниже. С использованием дискриминационного анализа могут быть проанализированы различия среди g групп (ранее определенных, g>2) с п наблюдениями: р независимых переменных могут быть объединены в одно или более линейное уравнение, называемое классифицирующей функцией:

В данном разделе анализ проводится по двоичной переменной (риск / нет риска), следовательно, вычисляется только одна классифицирующая функция. Коэффициенты классифицирующей функции рассчитываются с целью максимизации различия между группами. Наблюдения систематизируются в каждую из групп по классифицирующим меткам dy, рассчитанным для проанализированных наблюдений. Для расчета статистической значимости используются F-тест и р-значение.
В дискриминационном анализе приняты четыре основные гипотезы.
- 1) каждое наблюдение независимо;
- 2) каждая переменная должна иметь многомерное распределение;
- 3) диапазон дисперсии в переделах групп должен быть одинаковым;
- 4) ковариация в переделах групп должна быть одинаковой.
В практических приложениях эти гипотезы не полностью выполняются, но результаты дискриминационного анализа могут быть использованы для качественного анализа.