4.1.1. Поисковые системы и каталоги

Интернет содержит огромное количество информации. Это web-страницы, файлы, различные ресурсы, которые расположены зачастую на десятках серверов. И для того, чтобы выделить информацию по какой–либо конкретной тематике, необходим инструментарий для ее поиска и анализа. Таким инструментарием в браузере являются панель Поиск (Search) и специальные поисковые системы.


Информационно-поисковые системы размещаются в Интернете на общедоступных серверах. Основой поисковых систем являются так называемые поисковые машины, или автоматические индексы. Специальные программы-роботы (известные также как “пауки”) в автоматическом режиме периодически обследуют Интернет на основе определенных алгоритмов, проводя индексацию найденных документов. Созданные индексные базы данных используются поисковыми машинами для предоставления пользователю доступа к размещенной на узлах Сети информации. Пользователь в рамках соответствующего интерфейса формулирует запрос, который обрабатывается системой, после чего в окно браузера выдаются результаты обработки запроса. Механизмы обработки запросов постоянно совершенствуются, и современные поисковые системы не просто перебирают огромное число документов: поиск ведется на основе оригинальных и весьма сложных алгоритмов, а его результаты анализируются и сортируются таким образом, чтобы представленная пользователю информация в наибольшей степени соответствовала его ожиданиям.

Каждая поисковая система имеет свои особенности, и качество полученного результата зависит от предмета поиска и точности формулировки запроса. Поэтому, приступая к поиску информации, прежде всего нужно четко представлять себе, что именно и где планируется искать. Например, зарубежные системы поражают числом проиндексированных документов. Однако для поиска информации на русском языке, особенно в российской части Интернета, лучше приспособлены русские поисковые машины. Во-первых, они специально ориентированы именно на русскоязычные ресурсы Сети и, как правило, отличаются большей полнотой охвата и глубиной исследования этих ресурсов. Во-вторых, российские системы работают с учетом морфологии русского языка, то есть в поиск включаются все формы искомых слов. Российские системы лучше учитывают и такую исторически сложившуюся особенность российских интернет-ресурсов, как сосуществование нескольких кодировок кириллицы.

Интерфейс всех поисковых систем построен примерно одинаково. Пользователю предлагается ввести запрос в специальное поле, а затем инициировать поиск щелчком на кнопке. Система выполняет поиск и выдает результаты в окно браузера. Кроме того, многими поисковыми системами пользователю предоставляется возможность задать дополнительные критерии поиска. Например, можно искать только в определенной тематической категории или только на определенных серверах. Вот так, например, выглядит окно поиска системы Яндекс (рис. 3.23):




Рисунок 3.23 - Окно поисковой системы Яндекс

Успех поиска в значительной степени зависит от формулировки запроса. Вот несколько наиболее общих принципов составления запросов, применимых для большинства поисковых систем: