Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
seti_metod.doc
Скачиваний:
8
Добавлен:
12.11.2018
Размер:
501.25 Кб
Скачать
    1. Поиск информации

Internet содержит массу сведений практически на любую тему. Однако чаще всего пользователь не знает заранее адрес того сайта, где расположена интересующая его информация. Более того, ежедневно в сети появляются и исчезают сотни сайтов. Помочь пользователю разобраться в этом хаосе информации призваны поисковые сервера.

Поисковые системы являются наиболее посещаемыми ресурсами Internet и делятся на два типа: «каталог» и «паук». В каталогах сведения о сайтах рассортированы по тематике, и, как правило, добавляются самими создателями сайта. Удобно работать с каталогом, если Вы интересуетесь не отдельной страничкой, а определенной тематикой. Однако далеко не все создатели сайтов могут и хотят вносить информацию в каталог. Эту проблему решают поисковики второго типа, называемые «пауками». Ползая по переплетениям сети «пауки» ежечасно заползают практически на все доступные страницы и заносят их в специальную базу данных, по которой в последствии и ведется поиск. Практически каждая страница в Internet снабжена невидимым для пользователя, но доступным поисковикам списком кодовых слов, определяющих тематику сайта. Такой список называется индексом, создают его создатели сайта, а потому нередки случаи, когда индекс намеренно заполняется словами типа «секс», «порно», «девочки». Отсюда высокий интерес к этим невинным и чаще всего неинтересным страницам. Поэтому большинство поисковых систем не ограничиваются просмотром индекса, а сканируют всю страницу.

В настоящее время в сети функционирует около десятка русских поисковых машин. Наиболее популярные среди них Google (www.google.ru, www.google.com), Rambler (www.rambler.ru), Яndex (www.yandex.ru), Ау (www.au.ru). Зайдя на сайт поиска, пользователь в строке ввода набирает слово или набор слов, по которым будет осуществляться поиск. На первый взгляд, все достаточно просто, но в большинстве случаев из списка найденных адресов полезной оказывается примерно каждая десятая ссылка. Поисковая система никогда не догадается, что Вы имели в виду, набрав запрос «Маленькая лошадка», и выведет Вам официальный сайт сериала «Беверли Хиллз» (главная героиня в детстве обожала маленьких лошадок), сайт любителей пони, сайт Найка Борзова (песня «Маленькая лошадка») и т.д.

Таким образом, становится ясно, что запрос надо составлять тщательно, продумано используя базовые слова интересующей Вас темы. На многих поисковиках можно использовать так называемый сложный поиск, подразумевающий применение логических операторов Буля. Операторы на разных серверах употребляются разные, но чаще всего в сложном поиске задействованы следующие:

  • AND – «И», в искомом документе должны присутствовать все слова, разделенные этим оператором, слова могут стоять в разных частях документа. Эквивалент – знак +

  • OR – «ИЛИ», в документе должно присутствовать хотя бы одно из слов, разделенных этим оператором. Пример: (Клинтон AND скандал) OR Моника. Эквивалент – знак |

  • NOT – «НЕ», будут выбраны все документы, содержащие слово перед оператором, кроме тех, что содержат слово после оператора. Пример: (Клинтон AND скандал) NOT Моника. Эквивалент – знак -

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]