Современные дистанционно-компьютерные методы дешифрования воздействий на лесные массивы аварий магистральных трубопроводов

Современные компьютерные методы обработки аэрокосмических изображений

Методология дистанционного анализа состояния лесных массивов на основе аэрокосмических изображений с целью оценки воздействия аварий МТП на леса, в последнее время широко развивается на основе применения новых методов и инструментов аэрокосмического землевидения. Выделяют два класса методов обработки, или дешифрования, аэрокосмических изображений:

  • а) методы попиксельной классификации;
  • б) методы групповой классификации, способные распознавать целые лесные участки с однородными для заданных классов характеристиками.

Оба метода основаны на предположении, что на космических снимках различные классы техногенного повреждения лесов характеризуются определенным набором оптических плотностей и в целом структура пикселей объективно отражает их экологические характеристики.

При групповой классификации, в отличие от пиксельной, распознавание осуществляется на более высоком иерархическом уровне отдельных участков леса, что позволяет отнести ее к задачам дистанционного распознавания интегральных нечетких образов, которые представляют собой природные объекты на аэрокосмических изображениях. Существенным преимуществом данного метода является значительно меньший объем обучающей выборки, которая при использовании этого метода предварительно интегрирована в отдельные группы. Недостатком является жесткость и неизменность конфигурации границ участков, сформированных при проведении лесоинвентаризационных работ. В методе групповой классификации неконтролируемая классификация применяется редко. Обычно используется классификация на основе интегральных характеристик классов, полученных с помощью обучающей выборки.

Выделяют два основных метода классификации любого вида объектов, в том числе космических изображений:

  • - неконтролируемую классификацию без обучения (кластеризацию);
  • - контролируемую классификацию с обучением.

При неконтролируемой классификации объекты объединяются в отдельные кластеры, отличающиеся друг от друга по величине выбранных классифицирующих показателей. При наличии только двух классифицирующих показателей результат кластеризации может быть наглядно представлен на координатной плоскости. В настоящее время разработано достаточно большое количество алгоритмов кластеризации с использованием, как четких, так и нечетких методов обработки. Эти алгоритмы можно разделить на три больших класса: эвристические, иерархические и разделительные, или декомпозиционные. Последний класс наиболее часто используется для кластеризации изображений.

Кластерный анализ основан на понятиях плотности однотипных объектов, которая внутри кластера выше, чем вне его: на понятиях дисперсии; отделимости от других кластеров; размера; формы (например, кластер может иметь очертания гиперсферы или гиперэллипсоида) и пр. Методы кластеризации делятся на агломеративные и дивизивные. В агломеративных, или объединительных методах, происходит последовательное объединение наиболее близких объектов в один кластер. Процесс такого последовательного объединения можно представить графически в виде дендрограммы, или дерева объединения. Это удобное представление позволяет наглядно изобразить процесс кластеризации, выполняемый агломеративными алгоритмами.

Исходными данными для анализа аэрокосмических снимков могут быть собственно объекты или их параметры, например, яркость пикселей аэрокосмических изображений, категория земель, состав насаждений, возраст, полнота, тип леса и др. В некоторых случаях данные для анализа удобно представлять матрицей расстояний между объектами, i,j- й элемент которой является расстоянием между г-м и j-м объектами. Расстояние между объектами в пространстве параметров является одной из многих мер сходства между объектами: чем меньше расстояние между ними, тем более схожи объекты. При определении расстояний между объектами важную роль играет выбор метрики. Часто используют обычную Евклидову метрику, например, если объект описывается двумя параметрами, то он может быть изображен точкой на фазовой плоскости, а расстояние между объектами - это расстояние между точками, вычисленное по теореме Пифагора. Если не возводить в квадрат координаты вектора, а использовать их абсолютные значения, то получится так называемое Манхэттенское расстояние, или расстояние "городских кварталов".

Для некоторых задач Евклидова метрика может неподходить. В этих задачах используется понятие меры сходства объектов (расстояние - одна из возможных мер сходства). Важной мерой сходства, которая традиционно используется в статистике, является статистический коэффициент корреляции, например, коэффициент корреляции Пирсона.

Для бинарных данных используют другие меры сходства, например, вычисляют количество параметров, которые совпадают у объектов, а затем полученный результат делят на общее число параметров и получают меру сходства. Такие меры называют коэффициентами ассоциативности, из которых наиболее часто используются коэффициенты Жаккара и Гауэра.

При анализе результатов кластеризации необходимо учитывать особенности использованных алгоритмов. В агломеративных методах применяются алгоритмы: одиночных связей; полных и средних связей; алгоритм Уорда, идея которого состоит в том, чтобы проводить объединение, дающее минимальное приращение внутригрупповой дисперсии. Алгоритм Уорда образует кластеры примерно равных размеров, имеющих форму гиперсфер.

В некоторых методах кластеризации при отнесении объекта к очередному кластеру используются интегральные характеристики кластеров. Примером таких методов является итеративный метод k-средних, в котором используется понятие центра кластера. Под расстоянием между объектом и кластером понимается расстояние между объектом и центром масс кластера. Классифицируемый объект относится к тому кластеру, расстояние до которого минимально. Обычно под расстоянием понимается Евклидово расстояние, т.е. объекты рассматриваются, как точки Евклидова пространства.

Метод k-средних состоит из следующих шагов:

Шаг 1. Выбираются К исходных центров кластеров (центроидов) z^,z^,....,z^, где нижний индекс номер кластера, а верхний номер итерации.

В классическом методе k-средних этот выбор осуществляется произвольно, и обычно в качестве исходных центров используются первые К записей из базы данных.

Шаг 2. На m-м шаге итерационного процесса записи базы данных распределяются по К кластерам по следующему правилу:

где х - произвольная запись (или объект) базы данных, S(pm) - р-й кластер,

полученный на m-й итерации, d - расстояние в конфигурационном пространстве признаков, j = j*p.

Шаг 3. На основе результатов шага 2 определяются новые центры кластеров z(m+I), j = . При этом используется метод наименьших квадратов

так, чтобы сумма квадратов расстояний между всеми участками, принадлежащими кластеру j, и новым центром кластера была минимальной т.е., новые центры кластеров выбираются таким образом, чтобы минимизировать следующие функционалы:

Для Евклидовых расстояний формула расчета новых центров кластеров получается из условия равенства нулю производных функционала:

где для краткости обозначено г = г(+1). Из уравнения (2.2.3) следует:

Таким образом, новые центры кластеров определяются как средние арифметические по всем объектам, входящим в данный кластер.

Шаг 4. Шаги 2 и 3 повторяются до тех пор, пока не будет найдена устойчивая конфигурация, при которой кластеры перестанут изменяться, или число итераций не превысит заданное пользователем предельное значение.

Классический метод k-средних послужил основой для многих современных алгоритмов, одним из которых является алгоритм Izodata, включенный в состав многих инструментальных пакетов обработки аэрокосмических изображений. В этом алгоритме применяются дополнительные условия расщепления и объединения объектов в кластеры. Например, в качестве дополнительного параметра оценки связности кластеров используется стандартное отклонение объектов от центра внутри каждого кластера. В случае превышения стандартным отклонением заданного порога кластер расщепляется на два новых кластера. Преимуществом алгоритма является возможность кластеризации объектов в многомерном конфигурационном пространстве многозонального космического изображения. Недостатком алгоритма является необходимость указывать требуемое число кластеров. Результаты применения этого алгоритма к многозональному космическому снимку нефтяного месторождения Самотлор представлены на рис.2.2.1.

Известно, что одной из причин деградации растительности в районе нефтяных месторождений являются нефтяные разливы. При этом следует учитывать также и другие антропогенные факторы воздействия на ОПС, такие, как изменение гидрологического режима, техногенные загрязнения в ходе строительства и т. пр. К числу наиболее характерных для нефтяных месторождений антропогенных факторов воздействия на ОПС следует отнести отдельные буровые установки, кустовые площадки, скважины, дороги, трубопроводные просеки, линии электропередачи, факельные системы, карьеры и песчаные отвалы, насосные станции, заброшенные объекты инфраструктуры.

Одним из важных показателей оценки антропогенного воздействия нефтяных разливов на ОПС является изменение состояния растительности, как более долговременный фактор, чем присутствие в почве нефтепродуктов. На многих заброшенных объектах инфраструктуры ПНГХК произрастают вторичные леса в деградированном состоянии.

Следует также отметить, что свежие нефтяные разливы не видны под пологом леса. Их можно обнаружить лишь по косвенным признакам, среди которых важным является степень деградации лесной растительности в районе нефтяных разливов. На изображении трех кластеров хорошо выделяется кластер нефтепроводов и кустовых площадок. Диффузные области кластера могут быть связаны с сильно деградированной лесной растительностью. Это позволяет выделять участки сильной деградации лесов с использованием метода вычленения диффузных областей.

Кластеры, полученные с помощью алгоритма Izodata в многозональном космическом снимке нефтяного месторождения Самотлор. При классификации использовано

Рис.2.2.1. Кластеры, полученные с помощью алгоритма Izodata в многозональном космическом снимке нефтяного месторождения Самотлор. При классификации использовано: а - пять и б - три кластера

Рассмотрим пример применения средств программирования пакета Mat- lab для написания программы выделения диффузных областей третьего кластера и вычислить их суммарную площадь.

Как для методов контролируемой, так и для неконтролируемой классификации в качестве критериев разделения могут быть использованы различные показатели. Исходными показателями могут быть множества исходных измеряемых показателей объекта. Эти показатели могут применяться как в исходном виде, так и в виде более сложных комбинаций, например интегральных индексов и пр. При применении методов контролируемой классификации эти показатели должны быть рассчитаны для каждого класса обучающей выборки. Таким образом, отклонение характеристик объекта от интегральных характеристик кластера или класса может быть представлено в виде следующего многокомпонентного вектора, который назовем вектором рассогласования:

где а{к) - i-я компонента к-то кластера, 6, - характеристика объекта, п - количество показателей, использованных для классификации.

Компоненты вектора рассогласования используются для построения различных критериев и алгоритмов классификации. Самым простейшим и наиболее часто используемым на практике критерием является линейная функция:

где Wj - весовые коэффициенты, характеризующие приоритет соответствующего показателя. Линейные преобразования могут быть представлены в виде декомпозиции двух последовательных преобразований: подобия и поворота. Преобразование подобия изменяет длину радиуса-вектора объекта (в пространстве признаков), а преобразование поворота - поворачивает радиусвектор. При этом распознаваемый объект перемещается в пространстве признаков, удаляясь от одних кластеров и приближаясь к другим.

Аналогичные преобразователи используются в искусственных нейронных сетях (ИНС), которые в большинстве являются нелинейными преобразователями:

где / - нелинейный преобразователь логистического (или ступенчатого) типа.

Описанные методы и алгоритмы классификации широко используются при анализе по космическим изображениям последствий воздействия на лесные массивы аварий на газо- и нефтепроводах.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >