Экспертные системы и базы знаний
Итак, экспертные системы — это сложные программные комплексы, аккумулирующие знания специалистов в конкретных предметных областях и тиражирующие этот опыт для консультаций менее квалифицированных пользователей.
В целом процесс функционирования ЭС можно представить следующим образом: пользователь, желающий получить необходимую информацию, через пользовательский интерфейс посылает запрос к ЭС. Решатель, на основе базы знаний, генерирует и выдаёт пользователю подходящую рекомендацию, объясняя ход своих рассуждений при помощи подсистемы объяснений.
Приведенное выше разделение на этапы реализовано в среде KADS. В основе этого подхода лежит идея о том, что экспертная система является не контейнером, наполненным представленными экспертом знаниями, а «операционной моделью», которая демонстрирует некоторое нужное нам поведение в столкновении с явлениями реального мира. Приобретение знаний, таким образом, включает в себя не только извлечение специфических знаний о предметной области, но и интерпретацию извлечённых данных применительно к некоторой концептуальной оболочке и формализацию их таким способом, чтобы программа могла действительно использовать их в процессе работы.
В основу оболочки KADS положено пять базовых принципов.
- 1. Использование множества моделей, позволяющее преодолеть сложность процессов инженерии знаний.
- 2. Четырёхуровневая структура для моделирования требуемой экс- пертности - набора качеств, лежащих в основе высокого уровня работы специалистов.
- 3. Повторное использование компонентов модели в качестве шаблонов, поддерживающих нисходящую стратегию приобретения знаний.
- 4. Процесс дифференциации простых моделей в сложные.
- 5. Важность преобразования моделей экспертности с сохранением структуры в процессе разработки и внедрения.
Первый из принципов, положенных в основу KADS, состоит в том, что оболочка должна содержать множество частных моделей, помогающих найти ответ на эти вопросы. Примерами таких моделей могут служить:
- • организационная модель «социально-экономической среды», в которой должна функционировать система, например финансовые услуги, здравоохранение и т.п.;
- • прикладная модель решаемой проблемы и выполняемой функции, например диагностика, планирование расписания работ и т.д.;
- • модель задач, демонстрирующая, как должна выполняться специфицированная функция, для чего производится её разбиение на отдельные задачи, например сбор данных о доходах, формирование гипотез о заболеваниях.
Как правило, человек-эксперт знает о той предметной области, в которой он является специалистом, гораздо больше, чем может выразить на словах. Вряд ли можно добиться от него многого, задавая вопросы в общем виде, например: «Что вам известно об инфекционных заболеваниях крови?» Гораздо продуктивнее подход, реализованный в программе TEIRESIAS, который предполагает вовлечение эксперта в решение несложных репрезентативных задач из определённой предметной области и извлечение необходимых знаний в процессе такого решения.
Задавшись определённым набором базовых правил, представляющих прототип экспертной системы, TEIRESIAS решает в соответствии с этими правилами одну из сформулированных репрезентативных проблем и предлагает эксперту критиковать результаты. В ответ эксперт должен сформулировать новые правила и откорректировать введённые ранее, а программа отслеживает внесённые изменения, анализирует их на предмет сохранения целостности и непротиворечивости всего набора правил, используя при этом модели правил. В процессе анализа используется обобщение правил различного вида.
Проект COMPASS можно считать одним из наиболее ярких примеров использования традиционной методики приобретения знаний, базирующейся на соответствующим образом организованном опросе экспертов. Такая методология «выросла» из предложенной Ньюэллом и Саймоном методики анализа протокола (protocol analysis).
Остановимся на проекте OPAL, в котором использована другая методика, отличающаяся от традиционной в двух важных аспектах.
- 1. Эта методика ориентирована на частичную автоматизацию процесса извлечения знаний в ходе активного диалога интервьюируемого эксперта с программой.
- 2. Методика приобретения знаний предполагает использование стратегии, направляемой знаниями о предметной области.
Мы уже рассматривали программу TEIRESIAS, в которой использовалось множество средств поиска ошибок в существующем наборе правил, редактирования и тестирования откорректированного набора правил. Но для построения начального набора правил или отслеживания изменений в них программа TEIRESIAS не использовала какие-либо знания о предметной области. Программа OPAL, напротив, пытается «вытянуть» из пользователя как можно больше деталей, касающихся представления знаний и их использования. OPAL не является программой общего назначения. Она разработана для решения специальных задач и предназначена для формирования правил принятия решений на основе полученных от эксперта знаний.
Программа OPAL упрощает процесс извлечения знаний, предназначенных для использования в экспертной системе ONCOCIN. Последняя формирует план и заинтересована в использовании модели предметной области для получения знаний непосредственно от эксперта с помощью средств графического интерфейса. Понятие модель предметной области можно трактовать в терминах знаний различного вида, которыми обладает эксперт.
Независимо от того, о какой конкретной предметной области идёт речь, игре в шахматы или медицинской диагностике, всегда существуют некоторые предварительные условия или предварительный опыт, которыми должен обладать субъект или техническая система, чтобы воспринимать знания об этой предметной области. Если речь идёт об игре в шахматы, то, по крайней мере, нужно знать правила этой игры: как ходят фигуры, в чём цель игры и т.п.
Этот вид фоновых, или фундаментальных, знаний иногда в литературе по экспертным системам называют глубокими знаниями, противопоставляя их поверхностным знаниям, которые представляют собой хаотичный набор сведений о связях «стимул - реакция».
При разработке прототипа системы ONCOCIN одной из наиболее сложных оказалась именно проблема приобретения знаний. Например, имеются сведения, что ввод информации, необходимой для создания протоколов лечения рака лимфатических узлов, занял около двух лет и отнял у экспертов около 800 часов рабочего времени. Формирование последующих наборов протоколов в процессе развития системы занимало, как правило, несколько месяцев. При этом было отмечено, что эффективность процесса приобретения знаний системой в решающей степени зависит от того, насколько успешно инженер по знаниям справляется с ролью переводчика в процессе передачи знаний от экспертов программе. Желание избавиться от этой зависимости и вдохновило разработчиков на создание программы OPAL, которая помогла бы автоматизировать процесс приобретения знаний.
Используя эту программу, эксперт может сформировать новый протокол в течение нескольких дней. За первый год эксплуатации программы
OPAL в систему ONCOCIN было добавлено свыше трёх дюжин новых протоколов. Эффективность использованного в этой программе метода заполнения формуляров при вводе новых знаний во многом объясняется тем, что в программу включены базовые знания о той предметной области, в которой она используется. Включение этих знаний потребовало значительных усилий от инженеров по знаниям, которые ранее занимались общением с экспертами, но эти затраты затем с лихвой окупились. Успешное применение программы OPAL показало преимущество представления знаний о предметной области на нескольких уровнях абстракции по сравнению с подходом, предполагающим переключение основного внимания на детали реализации.
Технология извлечения знаний о предметной области у эксперта посредством опроса через терминал в последнее время стала использоваться во множестве экспертных систем. В большинстве из них эксперту предлагается заполнить экранные формуляры, информация из которых затем считывается в структурированные объекты, аналогичные фреймам. Примерами таких систем могут служить ETS. Но далеко не во всех системах такого рода имеется столь развитый графический интерфейс, как в программе OPAL, и существует возможность компилировать полученные знания непосредственно в правила принятия решений. Реализация этих возможностей в OPAL существенно облегчается особенностями структурирования планов лечения больных, на что обращали внимание и авторы этой разработки.
Опыт, приобретенный в ходе разработки программы OPAL, был затем использован при создании PROTEGE - системы более общего назначения. Последняя версия этой системы, PROTEGE-II, представляет собой комплект инструментальных средств, облегчающих создание онтологии предметной области и формирование программ приобретения знаний, подобных OPAL, для различных приложений. Вместо того, чтобы разрабатывать инструментальные средства общего назначения с нуля, авторы этой разработки пошли по пути повышения уровня абстракции ранее разработанного и успешно используемого приложения, как это было сделано при разработке системы EMYCIN на основе MYCIN.