Технологии обработки результатов поиска

Возможности АИПС по обработке результатов поиска можно рассматривать в следующих аспектах:

  • • управление формой представления документов и списков документов (оперативное изменение формата и наполнения, фрагментирование);
  • • управление последовательностью выдачи (сортировка, ранжирование, оперативные переходы с возвратами, «закладки»);

Механизм поиска

Стартовый объект

Лексическая основа для реформулировки запроса

Технология поиска

Постобработка выдачи

Интерфейсные средства управления

Поиск по терминам, выделенным в документе

Отдельный просматриваемый документ

Термины, выделенные пользователем

Булев поиск по всем текстовым полям с автоматической нормализацией терминов

Нет

Нет

Поиск «аналогов»

Отдельный просматриваемый документ

Содержание просматриваемого документа

Нечеткий поиск: по условию частичного вхождения с указанным порогом

Ранжирование по суммарному числу вхождений поисковых терминов

Диалоговая панель «Поиск аналогов»

Эвристический поиск

Множество документов предложения запроса из протокола

Термины всех поисковых полей из документов, отмеченных как релевантные (словника не предъявляемого пользователю)

Поиск по статистически наиболее значимым кластерам терминов из словника

В соответствии с порядком ранжирования кластеров

Нет

Контекстный поиск

Множество документов предложения запроса из протокола

Отмеченные термины словника, создаваемого системой из всех поисковых полей документов, отмеченных как релевантные

Поиск по кластерам терминов из словника, отмеченных как релевантные

В соответствии с порядком ранжирования кластеров

  • 1. Словник.
  • 2. Предложения протокола, содержащие результат поиска по каждому кластеру терминов
  • 6.4. Компоненты информационного поиска 335
  • • локализация результата на уровне отдельного документа или совокупности (отметка степени соответствия информационной потребности);
  • • использование фрагмента документа, ссылки на документ или совокупность документов в последующих запросах, а также для развития процесса поиска;
  • • использование результатов поиска для оценки качества поиска.

Развитые средства обработки результатов поиска предопределяют возможность разработки средств и технологий автоматической или автоматизированной реформулировки запроса.

Методы ранжирования документов в выдаче основываются на использовании количественных мер, отражающих либо статистику встречаемости[1] и взаимосвязи терминов в документах, либо статистику взаимосвязи документа с другими документами в выборке или в предметной области.

  • [1] Например, в [Courtois, 1999] проведен сравнительный анализ методов ранжирования результатов поиска использующих три стратегии.Первая предполагает наивысшее ранжирование документов, содержащих все перечисленные ключевые слова или термины. Вторая предоставляет наивысший ранг документам, которые содержат все заданныетермины в рамках одного предложения или фразы. Третья стратегияпредусматривает наивысшее ранжирование тех документов, которые содержат заданные термины в своих заголовках, резюме или аннотациях.На основании проведенных экспериментов сделан вывод о том, чтонаиболее точное ранжирование (соответствующее пользовательскимоценкам релевантности результатов) обеспечивает первая стратегия, анаименее точное — третья стратегия.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >