ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ИНТЕЛЛЕКТУАЛИЗАЦИИ КОМПЬЮТЕРНОЙ ОБРАБОТКИ ЗАПРОСОВ НА ОСНОВЕ СЕМАНТИЧЕСКИХ СТРУКТУР

Определение основных понятий

Налет антропоморфизма, сказывающийся на результатах исследований в области интеллектуальных систем, по-видимому, объективен, ибо предметом изучения и воспроизведения в данном случае являются мыслительные процессы человека. Используемая в качестве метода исследования аналогия стала основной причиной появления и быстрого распространения метафор, с помощью которых свойства разумных существ (людей) переносятся на компьютер. К подобного рода метафорам относятся: думающие машины, понимающие компьютеры, мыслящие устройства, разумные программы и др. Постепенно они стали терять свой условный первоначальный смысл, превращаясь в обычные понятия. Живучесть подобного рода метафор в научном мире объясняется трудностями, возникающими в процессе формирования определений таких фундаментальных понятий, как «мысль», «смысл», «понимание», «содержание», «значение» и т.д. Существование, хотя и устойчивого, интуитивного представления об их сущности, тем не менее не освобождает не только от определений, но и от их логико-философского осмысления. Последнее необходимо для корректной постановки задач, формулирования целей и направлений исследований в области интеллектуальных систем. Наличие же рабочих определений позволит достаточно ясно установить пределы адекватного воспроизведения форм и видов мышления, что, в свою очередь, возможно, поможет избежать напрасных усилий и затрат. Вначале приведем известные понятия и не совсем известные их логико-философские трактовки, а затем обсудим, каким образом эти понятия могут помочь в деле решения задачи машинного понимания текстов.

Тезис: можно ли посредством мышления установить формы мышления, еше у Канта не вызывал сомнения [34, с. 477], но на вопрос: какие из них можно адекватно отражать современными методами представления и обработки знаний, еще предстоит ответить. Для обсуждения этого вопроса воспользуемся современной терминологией, согласно которой со словом «форма» сочетается не «мышление», а «познание». Формы же познания известны следующие: чувственная (ощущение, восприятие, представление) и абстрактная (понятия, суждения, умозаключения). Двум формам познания соответствуют два вида понимания: непосредственное и опосредованное [14].

Непосредственное понимание основывается на памяти, в его основе лежит распознавание известной информации во входном сообщении. Большую роль здесь играют понятия, которые невозможно описать словами. Например, нельзя описать цвет, его можно только показать, запомнить, а потом распознавать. Понимание включено в процесс познания, вследствие чего человек может понимать и новые знания, для этого к операции распознавания должны подключаться и другие операции (например, классификация объектов). Такой процесс характерен для иного вида понимания — опосредованного.

Особую роль здесь играют понятия антропоморфного и машинного понимания текста. Важнейшие суждения в данной сфере, с нашей точки зрения правильные, мы возвели в ранг постулатов, которые послужили основой для проведения исследований.

Постулат 1 сформулирован нами в результате изучения трудов Витгенштейна, вслед за которым мы также будем считать, что мысль идеальна, но формы ее существования материальны. И таких форм бесконечное множество — это все аудио- и видеосимволы. Будем также считать, что в сознании человека эти формы существуют в виде моделей, отражающих какие-либо процессы или объекты. Человек постоянно сравнивает генерируемые им модели с объективной реальностью. Для нас это принципиально, так как модели являются основой для выполнения настоящих исследований. Заметим, что на этот счет существуют и иные точки зрения, в том числе противоположные.

Каждый из видов понимания реализуется одним из видов мышления, которые согласно работе [12] бывают такие: интуитивное, наглядно-действенное, наглядно-образное, словесно-логическое, творческое. Для частичного ответа на вопрос, какие из них могут воспроизводиться в компьютерных системах и в каком объеме, обратимся вначале к Фрейду, согласно учению которого психические процессы человека делятся на сознательные, предсознательные

зо

и бессознательные. Очевидно, те виды мышления, которые базируются на «сознательных» (осознанных) знаниях и используют осознанные методы их обработки, можно моделировать с большим или меньшим успехом, и на сегодняшний день в этом направлении имеются значительные достижения. Что касается бессознательного, то по отношению к нему Фрейд был безапелляционен и считал, что оно не может ни при каких обстоятельствах стать сознательным. Это указывает на полную невозможность моделирования неосознанных знаний.

Иная ситуация, и довольно перспективная с точки зрения моделирования, складывается с предсознательным. «Мы видим, однако, что есть двоякое бессознательное: скрытое, но способное стать сознательным, и вытесненное, которое само по себе и без дальнейшего не может быть сознательным... Скрытое бессознательное... называется нами предсознательным» [4, с. 186J. И если, как предполагал Фрейд, предсознательное стоит гораздо ближе к сознательному, нежели к бессознательному, то, возможно, это то, что позволит существенно продвинуться вперед в изучении моделирования видов мышления. Именно на эту форму знания авторы обращают пристальное внимание.

Применение категории «предсознательного» в интеллектуальных системах возможно лишь в ограниченном объеме и весьма условно, ибо, во-первых, эти системы не имеют сознания и, во- вторых, они не способны что-либо забывать и поэтому не нуждаются в восстановлении предсознательного «посредством соединения с соответствующим словесным представлением» [4]. Однако ничто не мешает интерпретировать ее в более узком понимании как нечто, что «всплывает» в памяти во время распознавания машинного смысла высказывания. То, что «всплывает», не забыто, но вызывается посредством ассоциаций, возникающих в процессе анализа текста. И если творческая мысль основывается на интуиции, которая, по Фрейду, недоступна для сознания, то ранее сформулированный вопрос более корректно звучит так: как далеко можно забраться в дебри «скрытого бессознательного», чтобы можно было его представить одним из способов моделирования знаний. Что касается вопроса, какие виды мышления доступны для воспроизведения, то на него пока можно ответить таким образом: все находящиеся в зоне осознанного знания и, условно, те, которые находятся в зоне предсознания.

Постулат 2, который восходит к Фрейду, мы сформулируем следующим образом: существует две формы бессознательного, первая, которая никогда не может стать сознательным, вторая — может. Вызов второй формы осуществляется с помощью ассоциаций. Именно этот вывод Фрейда послужил для нас опорой для создания новой формы представления знаний, названной в монографии ассоциативными сетями. Это новый вид моделирования знаний, аналоги которого используются довольно редко.

Практические аспекты реализации машинного понимания, фрейдистское «сознательное» и «бессознательное» вынуждают к разграничению знаний и методов их обработки. Как знания, так и методы их обработки могут быть осознанными или нет, и здесь важно, что именно является осознанным. Кроме того, категорию предсознательного также нужно рассмотреть под иным углом зрения, что позволит приблизить ее к тем понятиям, моделируемость которых более реальна.

Л. Витгенштейн — один из немногих ученых нового времени, отважившийся не только говорить о мышлении как предмете, но и давать касающиеся его определения 16]. Многие идеи, практически реализованные в современных интеллектуальных системах, восходят к фундаментальным воззрениям Витгенштейна. Прежде всего он настаивает на различии мысли и формы ее существования. Мысль идеальна, но формы ее существования (отображения) материальны. И таких форм бесконечное множество: все аудио- и видеосимволы (звуки, высказывания, постукивания, движения руками или предметами, световые вспышки и др.). Формы существования мысли — это все сплошь модели, отражающие какие- либо стороны или свойства реальных процессов, состояний. Человек постоянно сравнивает генерируемые им модели (формы, в которых запечатлены мысли) с объективной реальностью.

Особенно много споров вызывает понятие «иметь смысл» (текст смысл несет — текст смысла не несет). Л. Витгенштейн считает, что высказывание имеет смысл, если слова, составляющие его, имеют значение. Отдельные слова имеют значение, если они интерпретируемы, т.е. переводимы в другие символы, либо действия [6, с. 292]. Перевод осуществляется посредством определения или вызова у человека определенного состояния или остенсивного определения (т.е. с помощью иных символов).

Здесь заметим, что разные люди по-разному интерпретируют текст, и зависит это от образования, культуры, желаний и др. Интерпретация, как приписывание значений исходным символам текста, объясняется так: в тексте а —» с можно интерпретировать стрелку как последовательность событий awe или как отношение вкладывания объекта а вс. Таким образом, понимание — это:

  • • присваивание известных значений тому, что должно быть понято;
  • • ожидание (прогнозирование) появления соответствующего состояния, процесса, объекта;
  • • сравнивание результата понимания (модели мысли) с реальностью.

Существуют работы, в которых излагается противоположная точка зрения, т.е. отрицается всякий смысл в тексте. «Текст не содержит и не передает смысла, а является лишь инструментом сообщения «понимателю» того, какую реакцию хочет от него получить автор текста» [8, с. 319]. Здесь автор, развивая концепцию реагирования как основу раскрытия сущности понятия «понимание», по существу, подтверждает определение Л. Витгенштейна, что понять — значит правильно предвидеть (прогнозировать, ожидать) события. Однако Витгенштейн не сомневался, что текст несет в себе смысл и передает его потребителю (высказывание имеет смысл, если слова, составляющие его, имеют значение [6, с. 291]).

Далее, вместо того чтобы давать бесплодные определения того, что такое машинное понимание текста, мы приведем собственное разумение основополагающих понятий, которые должны быть положены в основу создания интеллектуальных систем:

  • 1) мысль не воспроизводима в компьютере, возможно лишь ее материальное отражение в форме антропоморфных моделей представления знаний;
  • 2) обе формы познания (чувственная и абстрактная), как и соответствующие им два вида понимания (непосредственное и опосредованное), а также все виды мышления, базирующиеся на осознанных антропоморфных знаниях и методах их обработки, воспроизводимы с помощью моделей представления знаний;
  • 3) смысл текста в той его части, которая касается придания значений его словам или символам с последующей интерпретацией этих значений, воспроизводим;
  • 4) понимание текста в смысле ожидания (прогнозирования) появления последующих слов, высказываний, событий, реакций и т.д. интеллектуальной системой возможно;
  • 5) моделирование предсознательного возможно, если применительно к компьютерным системам оно интерпретируется как ассоциативный вызов знаний для машинной интерпретации высказываний.

Следовательно, интеллектуальная система воспроизводит не разум, способный мыслить, а лишь имитирует в своем постформа- лизованном мире некоторые виды мышления на основе моделей представления знаний. Причем эти виды не имеют никакого отношения к творчеству. Это электронное устройство, которое, будучи

зз

снабженным предварительными знаниями, способно самооргани- зовываться, перерабатывая и используя новые знания, в том числе и собственный опыт.

В Средние века существовали специальные науки (герменевтика, экзегетика и гомилетика), целью которых было выяснение существа процесса понимания текстов. Герменевтика для понимания смысла текста использовала только текст, экзегетика — текст и контекст, а гомилетика, кроме перечисленных компонент, — еще и этические нормы, мотивы поведения, цели субъекта и пр. Эти науки положены в основу современного многоуровневого представления машинного понимания текстов. Придерживаясь классификации из работы [42, с. 111] в целях дальнейшего упрощения изложения материала, коротко напомним эти уровни.

На первом уровне для понимания текста используется сам текст; ответы на вопросы формируются на основе содержания, отражаемого текстом. Например, предложение «ПО «Восход» находится в городе Москве» позволяет ответить на вопрос: «Где находится ПО «Восход?» или же «Находится ли ПО «Восход» в городе Москве?».

На втором уровне для ответа используется не только текст, но и его логические расширения, полученные с помощью различных логик. Это позволяет выдавать информацию, которой нет в тексте, но ее можно вывести на основе логических правил, например «ПО «Восход» поставляло балки в III квартале 2005 года. Продукция «балки» относится к прокату». На основе данного текста можно ответить на вопрос: «Поставляло ли ПО «Восход» прокат в 2005 году?», используя транзитивный вывод: ПО «Восход» поставляло балки, балки относятся к прокату, значит, ПО «Восход» поставляло прокат.

На третьем уровне для понимания текста используется информация о субъекте, объекте, процессах или состояниях, которые невозможно вывести с помощью логик. Например, в тексте «Я встретил больного врача Иванова» невозможно определить, о ком идет речь. Для этого нужна дополнительная информация, которой нет в приведенном тексте.

На четвертом уровне используется не только текст, его расширения и знания об окружающей среде, но и различная аудио- и видеоинформация, поступающая по дополнительным каналам (искусственное зрение робота, распознавание речевых актов). Ярким примером машинного понимания этого уровня является принципиальная невозможность описания цвета, например синего. Его можно только показать, запомнить и впоследствии представить при соответствующем упоминании в тексте.

Пятый уровень предполагает использование, кроме текста и всего уже перечисленного, информации о целях коммуникации, общепризнанных ценностях общества, критериях оценки поведения и пр.

В работе [42] отмечается, что различные уровни имеют различную теоретическую и практическую проработку. Рассмотрим некоторые аспекты первого и третьего уровней, считая, что понимание есть не что иное, как приведение высказывания к правильному ожиданию, а смысл высказывание имеет тогда, когда каждая из его составляющих интерпретируема приписываемыми ему значениями.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >