Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информационные системы

Основные этапы и обобщенный алгоритм поиска информации

Принимая во внимание характер разделения элементов основной и информационной деятельности, можно сказать, что адекватность (в первую очередь полнота[1]) информационно-поисковой деятельности определяется следующими факторами:

  • • свойством концентрации-рассеяния информации, предопределяющим априорную неполноту любого отдельного ИР — источника информации практически по любой теме. Любой ресурс всегда ориентирован не только тематически (по отраслям знаний) и на определенный вид информации (НТД, патенты, отчеты НИР и т. д.), но также имеет свои системы представления и средства доступа к информации;
  • • свойством эмерджентности информации, предполагающим множественность и комбинативность использования любого информационного сообщения;
  • • свойствами информационно-поисковой деятельности, зависящей как от характера задач ОД, так и от особенностей человека — его возможностей по восприятию и интерпретации найденных документов (информация может быть потенциально полезной, но актуально не воспринятой, например, по причине недостаточности знаний получившего ее потребителя);
  • • свойствами вычислительной среды реализации АН ПС, для которой характерна жесткость процедур и предопределенная ограниченность форм представления информации.

В целом процесс информационного поиска может быть представлен как циклическая последовательность операций, выполняемых в совокупной человеко-машинной среде (сознании человека и в вычислительной машине), и в итоге реализующей своеобразное преобразование информационной потребности (ИП) в совокупность документов, содержание которых удовлетворяет эту потребность, т. е. информация найденных документов обеспечивает решение задачи ОД.

Собственно и информационная потребность имеет несколько форм, соответствующих разным стадиям процесса познания (когнитивным состояниям потребителя информации) — разным формам представления «проблемности» (разным формам проявления знания о незнании) объекта поиска. В [Tailor, 1968] определяют следующие типы информационной потребности.

Реальная информационная потребность, отражая проблемную ситуацию пользователя в несистематизированной форме (он еще не вполне осознана), характерна для начальной стадии ОД.

В процессе понимания проблемной ситуации реальная ИП преобразуется в осознанную ИП, представленную в виде вопроса или задачи на привычном естественном или научном языке, и затем преобразуется в поисковый запрос. Для запроса характерно то, что вопросы типа «Как?» и «Почему?» должны быть преобразованы в вопрос типа «Есть ли?», поскольку именно такая форма представления потребности является наиболее адекватной теоретико-множественной модели поиска. Преобразование вопроса в запрос происходит в сознании человека и имеет качественный характер. Переход от реальной к осознанной ИП тем сложнее, чем менее определена задача ОД: для задач проблемного типа этот переход наиболее труден, так как пользователь не представляет, какая именно информация нужна для решения его задачи. Наиболее адекватной формой представления осознанной ИП как поискового запроса может быть семантическая сеть — граф понятий, характерных для объекта поиска.

Поисковый образ запроса — конечная, обрабатываемая АИПС форма ИП — представляется лингвистическими средствами конкретной АИПС, причем лексический состав ПОЗ уже в значительной степени будет зависеть от особенностей выбранного информационного ресурса. Формирование ПОЗ, в отличие от других форм ИП, производится а среде АИПС, но эффективность процесса его составления, как и адекватность его самого, определяется не только интерфейсными возможностями системы, но также и информационной грамотностью и профессионализмом пользователя.

Отбор выполняется системой автоматически: механизм поиска включает в выдачу те документы, которые удовлетворяют формальному критерию отбора, т. е. если для этого документа предикат, построенный для выражения ПОЗ, принимает значение «истина». После этого пользователь через интерфейсные

Обобщенный алгоритм автоматизированного информационного поиска средства навигации осуществляет просмотр и оценку соответствия содержания отобранных документов реальной ИП

Рис. 2.12. Обобщенный алгоритм автоматизированного информационного поиска средства навигации осуществляет просмотр и оценку соответствия содержания отобранных документов реальной ИП.

Укрупненный алгоритм итеративного процесса поиска информации представлен на рис. 2.12.

С точки зрения системного подхода схема, представленная на рис. 2.12, полностью отвечает процессу построения на основе отыскиваемой информации некоторой системы знаний.

Соответственно, если система знаний определяется как Sj = , т. e. как множество понятий M„ которые в рамках закона композиции Z{ определены на множестве характеристических признаков Aj и связаны отношениями /?„ то назначение (роль) АИПС состоит в том, чтобы найти документы, содержащие термины, которые

  • • характеризуются признаками из Д;
  • • связаны отношениями из R/,
  • • используются в предметной области, соответствующей Д.

Такие термины, возможно, обозначают понятия из Л/, (или

близкие к ним) и, возможно, удовлетворяют конкретному системообразующему основанию и в итоге — соответствуют реальной потребности.

Именно наличие этих двух «возможно» предопределяют не- одноактность процесса поиска. Очевидно, что помимо автоматически выполняемой системой операции отбора, необходимо:

  • 1) предварительно (до отбора средствами АИПС) определить множество терминов, более или менее адекватно обозначающих понятия и связи[2];
  • 2) после отбора определить степень соответствия смысла (системообразующего основания) каждого найденного АИПС документа системообразующему основанию запроса — выраженной ИП, отражающей цель текущего поискового процесса.

Действительно, любая абстрактная идея, как и любой реальный объект, могут рассматриваться в различных аспектах (используя различные законы композиции), а для вербального описания могут использоваться различные слова и лингвистические конструкции, с разной или почти одинаковой полнотой и точностью представляющие существо описываемого. Более того, для реальных ретроспективных БД, включающих миллионы разнообразных по форме и содержанию документов, требование предварительного формулирования исчерпывающе точного выражения ПОЗ практически невыполнимо: нельзя построить точное описание вполне конкретно нужного (но еще только отыскиваемого) объекта, даже не имея уверенности в том, что такое или подобное описание хотя бы в какой-либо форме присутствует в базе.

Отсюда следует, что АИПС по существу обеспечивает отражение понятийной структуры (существующей в сознании потребителя) и терминологической структуры (в среде АИПС), а с функциональной точки зрения архитектура АИПС, помимо основного компонента — механизма поиска, должна включать (как и в ранее рассмотренных типах систем!) двухконтурное управление. Первый контур (внутренний цикл на рис. 2.12) должен обеспечивать соответствие характеристических признаков (информационной потребности на уровне ПОЗ), т. е. адаптацию запроса к лексике предметной области и ИПЯ информационного ресурса. Второй контур (внешний цикл на рис. 2.12) должен обеспечивать соответствие закону композиции — выбранному одному из возможных аспектов рассмотрения объекта поиска тому, который в наибольшей степени соответствует классу решаемой задачи ОД, характеру использования искомого решения, учитывающему связи с другими аспектами и предметными областями. Задача второго контура — адаптация и развитие (а, в частности, и «неуход») запроса на уровне осознанной ИП в контексте системы понятий зафиксированного аспекта.

Особенностью сложившейся ситуации в части распределения функций управления между человеком и АИПС является то, что основные определяющие функции управления — оценка и принятие решения, осуществляются человеком. Соответственно, данные, явно или неявно им для этого используемые (количественные параметры состояний и критерии), сосредоточены в памяти человека. Для передачи части или всех функций управления в среду ЭВМ необходимо, чтобы АИПС располагала структурами данных, обеспечивающими не только хранение тех или иных параметров о состоянии и этапах поиска, но и позволяющими получать показатели, количественно оценивающие результативность выполненных действий и, таким образом, эффективность средств и технологий, предоставляемых системой. Принципиально, что такие показатели могут отражать не степень приближения к цели поиска, а только динамику самого процесса, поскольку в ряде случаев человеку — субъекту управления, просто ничего не известно о существовании такого объекта или, открывая новое, он надеется, что до него такие объекты не описывали. В частности, именно поэтому количественно можно оценить только изменение поискового состояния, определяя, насколько очередной результат поиска лучше или хуже результатов предыдущих итераций. Соответственно, система должна располагать такими интерфейсными объектами, которые позволили бы зафиксировать системообразующее основание объекта поиска, что в свою очередь позволило бы свести управление к однопараметрической задаче: при зафиксированном аспекте поиска варьировать лексический состав ПОЗ, выражающего информационную потребность.

Отметим, что средства АН ПС, позволяющие устанавливать степень таких соответствий, представлены в конкретных системах очень по-разному: от наличия семантически глубоких рубрикаторов и тезаурусов предметных областей в специализированных информационных центрах до полного отсутствия каких-либо средств, что характерно для большинства поисковых Internet-машин. Наличие и функциональные возможности этих средств в итоге и определяют эффективность, а также управляемость процесса поиска, в том числе его длину (число итераций). Состав, структура и принципы организации и использования средств управления в АН ПС будут рассматриваться в следующих главах.

Контрольные вопросы
  • 1. Приведите примеры абстрактных систем.
  • 2. Приведите примеры материальных систем.
  • 3. Дайте определение понятия «информационная система»
  • 4. Дайте определение информационной технологии.
  • 5. Охарактеризуйте и классифицируйте информацию как основной объект обработки в ИС.
  • 6. Приведите классификацию ИС.
  • 7. Охарактеризуйте основные компоненты ИС.
  • 8. Перечислите и охарактеризуйте основные обеспечивающие подсистемы ИС.
  • 9. Охарактеризуйте назначение и характер информационных компонент в системах управления и в системах воспроизводства знаний.
  • 10. Определите понятие «информационная деятельность».
  • 11. Перечислите основные операции процесса поиска информации.

  • [1] Исходя из замещающей роли ИД, полнота информационного поиска может рассматриваться как наиболее «естественный» показатель эффективности ИС. Достаточно показательной иллюстрацией этого является предельный случай: требование исключительной полноты (100 %) поиска при проведении исследования на патентную чистоту заявки наизобретение или открытие. Очевидно, что в этом случае неполнота поиска может быть оценена величиной экономических потерь, понесенныхвследствие контрафактного (хотя и ненамеренного) использования чужой интеллектуальной собственности, соответствующий патент на которую (точнее, сведения о нем) не был своевременно найден.
  • [2] В классической модели индексирования термины выступают в качестве атрибутов (характеристических признаков), а связи обычно редуцируются до отношения совместной встречаемости объектов.
 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >
 

Популярные страницы