Приобретение знаний

Анализ предметной и проблемной областей. Предметную область можно определить как сферу человеческой деятельности, выделенную и описанную согласно установленным критериям. В описываемое понятие должны входить сведения об ее элементах, явлениях, отношениях и процессах, отражающих различные аспекты этой деятельности. В описании предметной области должны присутствовать характеристики возможных воздействий окружающей среды на элементы и явления предметной области, а также обратные воздействия этих элементов и явлений на среду. Работа по изучению и анализу предметной области при проектировании интеллектуальных систем оказывает решающее влияние на эффективность ее работы.

Специфика предметной области может оказывать существенное влияние на характер функционирования проектируемой интеллектуальной системы, выбор метода представления знаний, способов рассуждения о знаниях и т.д. В то же время можно привести примеры, когда интеллектуальные системы, ориентированные на использование в определенной проблемной среде, подходили для проблематики совершенно из другой области.

Говоря о проблемной области, имеют в виду комплексное понятие, включающее предметную область, решаемые задачи, цели, возможные стратегии и эвристики. Предметную область можно определить как объект или, например, производственную систему со всем комплексом понятий и знаний о ее функционировании. При исследовании проблемной области необходимы знания о задачах, решаемых, например, в производственной системе, и стоящих перед ней целях. Определяются также возможные стратегии управления и эвристические знания, используемые в процессе эксплуатации производственной системы.

При исследовании экономических и производственных систем, производственных объектов и решаемых ими задач с целью формализации знаний в БЗ и работе с ними в интеллектуальных системах необходимо учитывать специфику таких систем. Экономическим и производственным системам присущи динамичность функционирования, частая смена ситуаций, обновление больших массивов измерительных и других данных, характеризующих состояние объекта.

Они часто функционируют в условиях неполной определенности из-за действия случайных возмущающих факторов. Вместе с тем многие производства бывают вредными или протекают в опасной для человека среде, что предъявляет повышенные требования к надежности систем управления ими.

Таким образом, при проектировании БЗ надо определенным образом организовывать ее для работы в реальном времени, когда значительные объемы знаний и данных могут быстро изменяться и обновляться. Необходимо обеспечить точность и своевременность представления экспертизы и рекомендаций пользователю (требование работы в реальном времени), а также высокую надежность работы интеллектуальных систем (требование надежности и безотказности в случае использования их для опасных производств). Кроме того, сам характер задач, решаемых в экономических и производственных системах, в значительной степени влияет на процесс организации и проектирования интеллектуальных систем.

На характер знаний, возможность их структуризации, объемы, режимы работы с ними существенное влияние оказывают как область использования интеллектуальных систем (тип конкретного процесса, отрасль, среда функционирования системы), так и реализуемые интеллектуальными системами задачи, которые были перечислены выше.

В системах управления экономическими и производственными процессами знаниями могут являться описания конкретного процесса, характеристики компонентов, финансовая и аналитическая информация, фактографические знания или данные. Помимо этого знаниями являются эвристики, или правила, представляющие собой суждения на основе данных, для решения задачи управления, например когда необходим останов оборудования на ремонт, какими должны быть промежуточные запасы, значения технологических параметров при определенном качестве сырья и т.д. Эти правила, или эвристики, базируются обычно на прошлом опыте.

При решении задач диспетчерского управления знаниями являются, например, данные контроля, поступающие с датчиков измерения расхода и уровня, скорости потока, качественные характеристики продуктов, а также оперативная информация о ходе выполнения плана, поставках, сбыте и т.д. Знаниями являются в свою очередь реакции и действия управленческого персонала при определенных значениях и наборе данных контроля, действия в аварийных и критических ситуациях, координирующие действия между отдельными технологическими подразделениями завода в зависимости от производственной ситуации, и т.д. При проектировании и планировании производства в задачах в качестве знаний могут выступать иные совокупности данных и правил действий. Характер целей и стратегий управления для различных экономических и производственных задач и в разных областях приложения может также значительно отличаться.

Методы приобретения знаний. Приобретение знаний реализуется с помощью двух функций — получение информации извне и ее систематизация. При этом в зависимости от способности системы обучения к логическим выводам возможны различные формы приобретения знаний, а также различные формы получаемой информации.

Форма представления знаний для их использования определяется внутри системы, поэтому форма, которую может принимать информация, зависит от того, какие способности имеет система для формализации информации до уровня знаний. Чем выше способности компьютера к логическим выводам, тем меньше нагрузка на человека. Следовательно, от функций обучения требуется преобразование полученной извне информации в знания и пополнение ими базы знаний.

Методы получения информации от экспертов, позволяющие строить полные (в рамках проблемной области) и непротиворечивые базы экспертных знаний с использованием психологически корректных процедур получения знаний, описаны, в частности, в [7.6].

Ниже приведена классификация этапов обучения, соответствующих способностям компьютеров к формализации знаний [7.7].

A. Получение информации без логических выводов:

  • 1) ввод программ;
  • 2) ввод фактических данных.

Б. Получение извне информации, уже представленной в виде

знаний, т.е. получение:

  • 1) готового набора знаний, представленных во внутреннем формате;
  • 2) знаний, представленных во внутреннем формате, в режиме диалога;
  • 3) знаний, представленных во внешнем формате, и их понимание.

B. Обучение по примерам:

  • 1) параметрическое;
  • 2) на основе выводов по аналогии;
  • 3) на основе выводов по индукции — эвристическое обучение.

Г. Приобретение знаний на метауровне.

Категорию А можно назвать обучением без выводов, или механическим запоминанием, это простой процесс получения информации, при котором необязательны функции выводов, а полученная информация в виде программ или данных используется для решения задач в неизменном виде.

Категория Б — это получение информации извне, представленной в форме знаний, т.е. в форме, которую можно использовать для выводов. Обучающейся системе необходимо иметь функцию преобразования входной информации в формат, удобный для дальнейшего использования и включения в базу знаний.

Приобретение знаний на этом этапе происходит в наиболее простой форме: это знания, предварительно подготовленные человеком во внутреннем формате, какими является большинство специальных знаний, изначально заданных в интеллектуальных системах.

В случае прикладных систем инженерии знаний необходимо преобразовать специальные знания из какой-либо области в машинный формат, но для этого нужен посредник, хорошо знающий как проблемную область, так и инженерию знаний. Таких посредников называют инженерами знаний (инженерами по знаниям).

Для подготовки знаний в интеллектуальной системе необходимы вспомогательные средства типа редактора знаний, причем в процессе приобретения знаний в диалоге редактируются отдельные правила и восполняются недостатки существующих правил, т.е. ведется редактирование базы знаний.

Если знания заданы во внешнем формате, например на естественном языке, то следует преобразовать их во внутренний формат. Для этого необходимо понимать внешнее представление, т.е. естественный язык, графические данные и т.п. Фактически приобретение знаний и их понимание тесно связаны. Проблема понимания сводится не только к преобразованию структуры предложений — необходимо получить формат, удобный для применения.

Аналогичная проблема — преобразование во внутренний формат советов, подсказок по решению задач. В этом заключается одна из центральных проблем искусственного интеллекта. Она, в частности, изучает преобразование советов, подсказок, рекомендаций, представленных в терминах проблемной области, в процедуры.

Проблемы категории Б возникают из-за того, что описание, или, что то же самое, представление знаний, задается извне в некотором формате. При этом необходимо всего лишь преобразование форматов представления информации, но функция открытия не требуется.

Напротив, в категории В есть свои особенности приобретения знаний: здесь выполняется сбор отдельных фактов, их обобщение и использование в качестве знаний. Для этого уже необходимо выявить общие понятия, вытекающие из примеров, и выбрать формат или структуру информации для их представления. В зависимости от уровня функций выводов могут возникать как сравнительно простые, так и сложные предсказания. Высший уровень категории В — эвристическое обучение. В этом случает представление знаний наиболее сложное. Практически эвристическое в полном смысле обучение не реализовано. По сравнению с категориями А и Б методы обучения по категории В имеют большую степень свободы.

Параметрическое обучение — наиболее простая форма обучения по примерам или наблюдениям — состоит в определении общего вида правила, которое должно стать результатом вывода и последующей корректировки входящих в это правило параметров в зависимости от данных. При этом используются психологические модели обучения, системы управления обучением и другие системы.

Обучение на основе выводов по аналогии — приобретение новых понятий — возможно путем преобразования существующих знаний, похожих нате, которые собираются получить. В нашей жизни много примеров, когда новые понятия или технические приемы приобретаются с помощью аналогий. Выводы по аналогии — один из важных объектов исследования ИИ.

Обучение на основе выводов по индукции — эвристическое обучение — среди всех форм обучения выделим особо. Это обучение с использованием выводов высокого уровня, как при обучении по аналогии. В процессе этого обучения путем обобщения совокупности имеющихся данных выводятся общие правила. Обучение этой категории включает открытие новых правил, построение теорий, создание структур и другие действия, причем модель теории или структуры, которые следует создать, заранее не задаются, поэтому их необходимо разработать. Исследование структурированных выводов активно ведется многими специалистами, но такие выводы пока еще не реализованы. Индуктивные выводы возможны в случае, когда представление результата вывода частично определяется из представления входной информации.

Рассмотренные категории обучения и приобретения знаний реализуются на объектном уровне, но еще более сложная проблема — приобретение знаний на метауровне (категория Г в нашей классификации), т.е. знаний, основой которых является информация по управлению решением задач с использованием знаний на объектном уровне. Для знаний на метауровне пока не установлены ни формы представления и использования, ни связь со знаниями на объектном уровне, ни другая техника их систематизации.

Поскольку не определена форма их представления с точки зрения использования, то трудно говорить о приобретении знаний на метауровне. Тем не менее с этой проблемой связаны многие надежды в инженерии знаний.

Выявление источников знаний. Выявление источников знаний и работа с ними — основная задача инженера знаний, который выполняет важные функции при разработке БЗ. Он должен хорошо ориентироваться в проблемной области и быть неплохим психологом, чтобы общаться с экспертом в процессе приобретения знаний. Вместе с тем он должен хорошо знать возможности программного обеспечения компьютеров, чтобы структурировать знания для хранения и работы с ними.

Основным источником знаний о проблемной области является человек-эксперт. Инженер знаний работает с ним в режиме диалога или интервью и формирует необходимый объем знаний и сведений для работы с объектом. Возможно также использование опросников, которые затем соответствующим образом обрабатываются. Для некоторых задач источниками дополнительной информации являются книги, технологические описания, инструкции, документы. Используются также методы так называемого мозгового штурма, когда группа специалистов в определенной обстановке в оперативные сроки генерирует необходимую информацию, помогающую разрешить проблему и лучше исследовать предметную область. Для некоторых областей применения интеллектуальных систем знания об объекте можно формировать путем использования статистической обработки информации и информации о результатах имитационных экспериментов. В последнее время все чаще начинают использовать методы автоматизированного заполнения БЗ.

Другим важным источником знаний является Интернет. Помимо традиционного поиска необходимой информации и знаний в Интернете в настоящее время в процесс поиска знаний вовлекаются интеллектуальные агенты. Интеллектуальные агенты (программные роботы) для нахождения или доступа к знаниям могут работать внутри документов или искать в веб, а затем возвращаться со знаниями в нужном формате.

Работа с экспертами и проблема извлечения знаний. Интеллектуальные системы создаются совместно со специалистами, которые передают свои знания о процессах и объектах, поясняют схему рас- суждений по выбору решений конкретных задач, приводят нефор- мализуемые факторы, которые необходимо учитывать. Процесс работы с экспертами или специалистом состоит в извлечении знаний или, более корректно, приобретении знаний. Процесс этот сложный, трудоемкий, содержит факторы технического, психологического, производственного и социального характера. Большую роль в данном процессе играет инженер знаний. В течение долгого времени он работает совместно с экспертом, определяя задачи, выявляя наиболее важные понятия, определяя и формулируя правила отношений между понятиями. Инженер знаний должен хорошо знать предметную область, владеть методами формализации и представления знаний, другим инструментарием искусственного интеллекта, быть психологом, быстро ориентироваться в различных ситуациях.

Эксперт должен желать и быть в состоянии помочь в изучении предметной области и осознавать, что интеллектуальные системы призваны помочь им в практической деятельности, а не вытеснять их.

Инженеру знаний обычно приходится работать с плохо определенными задачами, в которых отсутствует детерминированная внутренняя структура. В своей практической деятельности эксперты при решении этих задач используют эвристики — эмпирические правила, применяемые в случаях, когда условия оперативности решения задачи или недостаточное понимание существа проблемы делают невозможным анализ всех параметров задачи. Поэтому в интеллектуальных системах для решения задач стремятся заложить эвристические процедуры.

Трудный момент в работе инженера знаний — оказание помощи эксперту при попытках структурировать предметные знания, определить и формализовать предметные концепции. Работа, связанная с получением знаний, имеющихся у конкретного лица, т.е. извлечение знаний, в инженерии знаний имеет немаловажное значение. Необходимостью извлечения знаний специалиста разработчиком интеллектуальной системы нельзя пренебрегать не только из-за того, что полностью автоматизировать этот процесс необычайно сложно, но из теоретических соображений.

В чем особенность извлечения знаний для интеллектуальных и экспертных систем? Ответ можно получить, ответив на другой вопрос: откуда, что и как извлекать?

Откуда извлекать знания? Как отмечалось выше, источниками знаний для интеллектуальных и экспертных систем могут быть учебники, справочники, материалы конкретных исследований в проблемной области, экономическая информация и т.п. Тем не менее классический источник знаний — это эксперт в данной области, знания которого получает разработчик систем, выступающий в роли инженера знаний. Кто же такой эксперт? Это либо специалист высокой квалификации (в отличие от обычного исполнителя) либо человек с опытом (в отличие от новичка).

Изучение общих особенностей эксперта — это не только одна из возможных целей, к которой следует стремиться в человеко-машинных системах, состоящих из интеллектуальной системы и пользователя, это важно для того, чтобы заранее знать особенности партнера, от которого мы будем получать знания.

Известно, что чем выше способности эксперта в проблемной области, тем более он не способен к описанию знаний, используемых им для решения задачи. Это называют парадоксом инженерии знаний. Если спросить у эксперта, что он конкретно делает, решая задачу, то он объяснит наиболее правдоподобный, по его мнению, но совершенно отличный от реального процесс рассуждений. Поэтому здесь нужно быть осторожным.

Существует мнение, что знания эксперта систематизируются вместе с внешней моделью задачи и мгновенно выбираются из памяти в ответ на каждую конкретную ситуацию, и лишь в ситуации, с которой эксперт сталкивается впервые, порядок их выборки будет определяться сознательно по наиболее общим закономерностям.

Какие знания извлекать (что извлекать?). Если функции системы уже определены, то, естественно, самое важное — получить правила выводов, которые необходимы для реализации этих функций. Прежде всего это базовая структура. Важно перечислить объекты, понятия и атрибуты, которые формируют базовую структуру проблемной области, и знать свойства области. Связь между объектами, понятиями и атрибутами организуется через правила вывода. Далее — критерии разумности, т.е. почему эксперт решает некоторую проблему именно данным способом? Может быть, этот способ имеет высокую эвристическую ценность, а может, подготовлен на случай неудачи? Какая этому способу нужна поддержка? Средства, используемые экспертом, например модели принятия решений, используемые им при принятии решений.

Как извлекать знания? В табл. 7.2 приведены основные методы извлечения знаний из предметного эксперта и их описание.

Таблица 7.2

Методы извлечения знаний предметного эксперта

Метод

Описание

Наблюдение на рабочем месте

Наблюдать за экспертом, решающим реальные задачи на своем рабочем месте

Обсуждение задач

Выявить виды данных, знаний и процедур, необходимых для решения конкретных задач

Описание задач

Попросить эксперта описать прототипную задачу для каждой категории возможных ответов

Анализ задачи

Представить эксперту ряд реалистических задач для решения вслух с целью выявить логические основания конкретных шагов рассуждения

Доводка системы

Попросить эксперта предоставить вам несколько задач для решения и с использованием правил, выявленных во время интервью

Оценивание системы

Попросить эксперта проверить работу системы и подвергнуть критике правила и структуру управления прототипной системой

Проверка системы

Предоставить примеры, решенные экспертом и прототипом системы, другим независимым экспертам для сравнения и оценки

Технику извлечения знаний можно разделить на шесть основных классов: опрос с наводящими вопросами, структурированный опрос, самонаблюдение, самоотчет, диалог, критический обзор. Каждый класс в свою очередь состоит из нескольких технических методов. Подробную информацию мы рассматривать не будем, укажем только, что цель извлечения знаний может быть достигнута различными способами в зависимости от того, как эти знания будут анализироваться.

Эксперт, способный работать с вычислительной техникой, может также взаимодействовать с интеллектуальной системой непосредственно через редактирующую программу. Эта программа должна обладать развитым диалоговым интерфейсом и знаниями о структуре БЗ. Однако возникает проблема эффективности взаимодействия эксперта с программой.

Еще одним способом приобретения знаний системой является автоматизация извлечения знаний и запись их в БЗ. Неавтоматизированный сбор знаний специалистов — трудоемкий процесс. В связи с этим в развитых интеллектуальных системах предусматриваются вспомогательные средства для приобретения знаний.

Интернет или интранет также может использоваться для облегчения процесса извлечения знаний. Электронное интервьюирование может проводиться, если инженер знаний и эксперты находятся в различных местах. Также эксперты могут утверждать и сопровождать базы знаний на расстоянии. Посредством Интернета могут быть достигнуты документированные знания. Проблемой является идентификация знаний: задача, которая может быть облечена интеллектуальными агентами.

Актуальна также задача автоматической структуризации неформальных знаний, доступных в Интернете через распределенную гипермедиасистему — веб. Технология гипермедиа через веб обеспечивает идеальный подход для развития систем, основанных на знаниях путем расширения возможностей каналов человеко-машинного взаимодействия. Этот новый подход к интеграции технологии гипермедиа с извлечением знаний имеет дело со знаниями до того, как они будут формализованы. Многие веб-механизмы поиска включают интеллектуальных агентов для идентификации и поставки требуемой информации по индивидуальным потребностям и запросам. Причина экспоненциального роста количества информации, обеспечиваемого через веб-механизмы, вызывает развитие методов структуризации информации в распределенных гипермедиасистемах. Такая интеграция между технологией гипермедиа и методами извлечения знаний может обеспечить мощный инструмент для извлечения знаний.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >