Меню
Главная
Авторизация/Регистрация
 
Главная arrow Прочие arrow Основы научных исследований

МЕТОДИКА ИНФОРМАЦИОННОГО ПОИСКА

Поиск в Интернете

Интернет сегодня представляет собой один из богатейших источников информации. Современное исследование без обращения к ресурсам Интернета практически невозможно. К тому же это практически наиболее эффективный источник информации. Его полезность и универсальность со временем будут возрастать не только в результате пополнения новой информацией, но и вследствие все более углубляющегося во времени ввода ретроспективных данных.

Успех поиска в Интернете в наибольшей степени зависит от сформированных там каталогов. Но уже сегодня объем информации, накопленной в Интернете, исчисляется миллиардами страниц. В результате каталогизация имеющихся в Интернете ресурсов стала серьезной проблемой. И проблема эта, несмотря на предпринимаемые многочисленными организациями и коллективами усилия, не только не приближается к разрешению, но и становится острее. Доля каталогизированных (индексированных) ресурсов неуклонно падает: интернет- пространство быстрее наполняется, чем систематизируется. В итоге поиск информации в World Wide Web стал самой трудной задачей в Интернете. Решить ее помогают специальные поисковые системы.

Большую проблему при поиске информации составляют ошибки и неточности, обусловленные тем, что попадающая в Интернет информация отражает разные источники, в том числе нередко содержащие опечатки, неаккуратность авторов соответствующих текстов, субъективную точку зрения авторов, их неграмотность, в том числе элементарную. Используя Интернет, необходимо постоянно помнить, что это по сути лишь отражение фактических текстов и другой информации без какого-либо критического их осмысливания. Поэтому во всех случаях возникновения минимального сомнения или подозрения следует обязательно проанализировать несколько источников, чтобы отсеять неадекватные.

Поисковые системы Интернета

Поисковые каталоги

В Интернете каталоги и указатели различаются технологией подготовки. Каталоги составляют люди, а указатели формируются автоматически. При каталогизации информационного ресурса (книги, статьи и т.п.) специалист-редактор просматривает его, определяет, к какой области знаний относится данный ресурс, устанавливает его категорию в этой отрасли и вносит ресурс в каталог.

Одним из свидетельств качества интернет-страницы является число ссылок на нее в других интернет-страницах, причем чем их больше, тем эта характеристика выше, указывая, что рассматриваемая интернет- страница популярна и обладает высоким показателем цитирования.

При поиске информации в интернет-сети полезно руководствоваться некоторыми общими правилами и рекомендациями.

  • • поиск по группе ключевых слов (даже по фразе) эффективнее прямого поиска по одному слову;
  • • поскольку в разных системах используются разные правила для записи группы слов, целесообразнее пользоваться одной и той же, привычной поисковой системой, особенности работы в которой освоены конкретным исследователем в наибольшей степени;
  • • при вынужденном поиске по одному слову лучше использовать несколько разных поисковых систем, чтобы не пропустить какой-либо значимый ресурс.

За рубежом первые поисковые указатели возникли в 1994-1995 гг., в России — в 1996-1997 гт.

Исторически наиболее популярная поисковая система — Рамблер. Она начала работать раньше других и долгое время лидировала по размеру поискового указателя (около 15 млн) и качеству услуг поиска. Недостатком этой поисковой системы является то, что она слабо обновляется и дает устаревшие результаты.

Самый большой указатель лежит в основе системы Яндекс — около 30 млн интернет-страниц, к тому же использующих самые актуальные ресурсы.

За рубежом поисковых указателей гораздо больше. Только в число крупнейших входят не один десяток. Наиболее популярные из них — Google (www.google.com), AltaVista (www.altavista.com), Fast Search (www.alltheweb.com), Northern Light (www.northemlight.com) с указателем почти 300 млн интернет-страниц и сочетанием индексации и каталогизации.

Конкретные оценки разных поисковых указателей в силу быстрого изменения ситуации в Интернете очень быстро стареют. Поэтому целесообразно время от времени проверять эффективность используемых систем, а также становящихся популярными. Проверке следует подвергать актуальность ссылок и степень корректности представляемых результатов поиска.

Для проверки качества работы поисковой системы надо задать ей запрос на поиск таких сведений, которые появились недавно и в плохо обновляемой системе отражены быть не могут.

Правила поиска информации с помощью конкретной системы содержатся в соответствующем сайте. Однако есть несколько общих приемов, разновидностей поиска, зависящих от используемых алгоритмов поиска: простой поиск, расширенный поиск, контекстный поиск и специальный поиск.

Простой поиск — в поле запроса вводится одно или несколько слов, которые могут характеризовать содержание документа. Если ввести одно слово, то, как правило, выдается такое большое число ссылок, что с ними не совладать. Если же вводится несколько слов, то результат зависит от того, как эти слова обрабатываются в конкретной поисковой системе, что указано в инструкции по ее использованию.

Расширенный поиск обрабатывает запрос из группы слов, которые можно объединять логическими операторами AND («И»), OR («ИЛИ»), NOT («НЕ») и др. При расширенном поиске объем выдаваемой информации резко уменьшается посредством исключения «информационного шума». Записи ключевых слов и логических операторов в разных системах, как правило, одинаковы или очень схожи. В результате приемы расширенного поиска можно использовать в разных системах.

Контекстный поиск очень эффективен, но реализован не во всех поисковых указателях. При этом виде поиска отбираются источники, в которых требуется точное совпадение фразы или группы слов поискового образа, заключаемого, как правило, в кавычки.

Специальный поиск обеспечивает с помощью соответствующих команд отыскание дополнительной информации, например, с их помощью можно найти ключевые слова, входящие в заголовки интернет-страниц и т.п. Как правило, специальные команды в различных поисковых системах индивидуальные.

Приведем для начала несколько поисковых систем российского Интернета (Рунета), а дальнейшее наполнение этого списка оставим читателю.

FileSearch.ru обеспечивает поиск среди миллионов файлов, собранных практически со всех российских FTP-серверов и нескольких тысяч серверов по всему миру. База поиска постоянно обновляется (не реже одного раза в несколько дней), а неработающие ссылки удаляются.

Global Search. Вам предоставляется возможность искать информацию в Интернете, используя одновременно ресурсы основных / поисковых машин и каталогов.

Search.da.ru одновременно ищет запрошенную информацию в нескольких самых известных каталогах русских ресурсов Интернета (stars.ru, Rambler's Тор 100, www.ru, @Rus, List.ru). Можно отметить те источники, в которых надо искать интернет-сайты. Результаты, выданные каждым из выбранных интернет-каталогов, группируются, после чего общий итог выводится на единой странице.

Поисковая система «Букинист» (bukinist.agava.ru) предназначена для поиска книг и других электронных текстов, имеющихся в свободном доступе в Интернете.

«Епрст!» — это поисковая система с простым дружественным интерфейсом. Она позволяет пользователям максимально быстро найти нужную информацию, регулярно обновляет ссылки и проверяет сайты на соответствие заявленным ключевым словам и темам.

Сайт www.sergo.net посвящен научным исследованиям и вопросам образования. Кроме каталога научных ресурсов Интернета, в котором содержится большое число ссылок на университеты всего мира, здесь есть поисковая система, позволяющая вести поиск одновременно по всем наиболее эффективным поисковым машинам России и дальнего зарубежья. Кроме того, в «Журнале» можно ознакомиться с научными публикациями по разнообразным темам и опубликовать свои работы, а также обсудить различные волнующие вас вопросы с коллегами на форуме.

Сайт Российской национальной библиотеки www.rsl.ru обеспечивает доступ к разделам «Отечественные книги», «Зарубежные периодические издания», «Диссертации», «Авторефераты».

Особо представителен электронный каталог ГПНТБ России (www.gpntb.ru), являющейся государственным депозитарием отечественной и зарубежной научно-технической литературы, собранной здесь наиболее широко.

В качестве примеров могут быть упомянуты некоторые специализированные библиотеки.

Центральная научно-техническая библиотека (www.cntb-rzd.ru) ОАО «Российские железные дороги» (до 1 октября 2003 г. — ЦНТБ МПС) — одна из старейших библиотек России. Она имеет богатейшие фонды и возглавляет сеть технических библиотек железных дорог (Корпоративная библиотечно-информационная система ОАО «РЖД»).

Центральная научно-техническая библиотека по строительству и архитектуре (www.gosstroy.ru/cntbl.htm) — это специализированная библиотека строительной отрасли, имеющая уникальные фонды по строительству, архитектуре и смежным отраслям знаний, включающие в себя производственно-техническую литературу, монографии, сборники трудов, материалы симпозиумов и конференций, энциклопедии, словари, справочники, учебники и учебные пособия, периодические издания как на русском языке, так и иностранные издания.

Богатые фонды специальной научно-технической литературы имеют библиотеки крупнейших вузов.

Проведение научных работ немыслимо без патентных исследований. В любой научно-технической разработке первый этап — это патентный поиск. Эффективно эту работу можно выполнить сегодня практически только с помощью Интернета.

Наиболее полная электронная база патентов США находится по адресу www.uspto.gov и охватывает период с 1 января 1976 г. Еще один хороший источник патентной информации — сервер mems.isi.edu.

Есть два типа поисковых систем. Первые относят к разряду каталогов — сведения о страничках Интернета рассортированы в них по тематике и, как правило, добавляются в поисковик самими создателями страничек. С каталогами удобно работать при выборе темы, а не отдельной странички.

Кроме поисковых машин общего профиля, существуют и специализированные поисковики — например, по научной информации. Собственные поисковые машины существуют и для серверов FTP, например www.filez.com.

Определение поискового вопроса

Это важнейший момент поиска, особенно в интернет-системах. Вопрос формулируется на естественном языке, он должен быть максимально тесно связан с контекстом.

При анализе результатов поиска большое внимание должно быть уделено связи их с конкретными стадиями цикла публикации, имея в виду следующие возможные источники информации.

Текущие источники, которые содержат информацию о самых ранних этапах работы, когда она только началась или находится в стадии подготовки.

Первичные источники — печатные или электронные, в которых результаты работы впервые представляются в формальном виде.

Вторичные источники — каталоги, списки и т.п., представляющие первичную информацию в сжатом виде, облегчая поиск и оценку первичной информации.

Третичные источники каталогизируют, упорядочивают и дают рекомендации по работе с вторичной (а иногда — и с первичной) информацией в связи с тем, что появилось большое число справочных и документальных (исходных) БД. Третичный источник позволяет, в частности, установить, есть ли вообще какая-нибудь БД, где упоминаются, например, тезисы последней конференции по конкретной тематике.

БД могут также различаться в зависимости от характера содержащейся в них информации: ссылки на другую информацию (справочная информация) или фактически сама информация {исходные данные) независимо от того, на какой стадии цикла публикации она находится.

 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >
 

Популярные страницы