Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
+ИНФОРМАТИКА 2 курс.doc
Скачиваний:
85
Добавлен:
30.04.2019
Размер:
13.1 Mб
Скачать

Тема 3.5 Информационно-поисковые системы

Студент должен:

иметь представление:

  • об основных типах информационно-поисковых систем, представ­ленных на отечественном рынке и доступных в сети Internet;

  • назначение и основные принципы построения информационно-поисковых систем;

знать:

  • назначение и возможности информационно-поисковых систем.

Назначение и возможности информационно-поисковых систем. Струк­тура типовой системы. Информационно-поисковые системы, представлен­ные на отечественном рынке и доступные в сети Internet. Порядок работы с типовой локальной и сетевой системой.

Практическое занятие 18 Работа с информационной поисковой системой

Различные службы поиска предназначены для того, чтобы помочь вам найти нужную информацию в Сети.

Большинство служб поиска работают, нацеливаясь на поиск по ключевому слову, используя при его анализе специально разработанные алгоритмы. Выбор той или иной службы поиска зависит от того насколько удобным покажется вам ее интерфейс, а оформление выводимой информации будет соответствовать вашим пожеланиям.

Ниже, чтобы не отдавать никому предпочтения, в алфавитном порядке представлены несколько бесплатных служб поиска в Сети...

Зарубежные службы поиска

Российские службы поиска

AltaVista

Апорт

Excite

AtRus

Google

Лупа

Google (Rus)

Metafora

HotBot

Metabot

Infoseek

Punto

Lycos

Rambler

Lycos (Rus)

Яndex

MegaGo

Зарубежные службы поиска

Службы поиска стран СНГ

Northern Light

All BY (Белоруссия)

WebCrawler

Meta (Украина)

Yahoo

Moldova (Молдавия)

UAPort (Украина)

Один из методов поиска, если поисковая машина позволяет, - это введение явных ограничений (запрещенных слов). Другой метод состоит в правильном формировании запросов, в частности,- в предпочтении нескольких конкретизированных запросов одному общему. К сожалению, весьма ограниченный входной язык большинства машин не оставляет особенного простора для творчества в этом направлении.

Другая, связанная с этой, проблема - неоднозначность человеческого языка. Если сфера ваших интересов - нефть, то около половины вываленных на вас ссылок будет касаться... живописи. Картина маслом, так сказать... К проблеме синонимов в русскоязычном Интернете добавляется еще проблема морфологических вариаций слов. Изготовим платы, изготовление плат... Добавьте сюда наличие в языке омонимов (абонентная плата, а в некоторых системах также зарплата и платан), и работа с тезаурусом покажется уже не блажью, а суровой необходимостью

Много головной боли в нашем отечественном Интернете происходит от обилия кодировок. Существуют три (!) основных кодировки, каждая из которых еще может существовать в вариациях (например, расположение буквы Ё в КОИ-8). С этим общим врагом каждый борется, как умеет. Российские поисковые машины распознают вашу кодировку и кодировку сайта и пытаются по мере возможности привести их в соответствие. Это удается, но не всегда. Иначе: если вы ищете слово "Финансы", а на сайте ему соответствует загадочное "тХМЮМЯШ", поиск вряд ли будет удачным.

Поиск может быть неудачным и в силу формы представления информации. Данные, лежащие в базе, "не цепляются" ни поисковой машиной, ни спайдером. Например, информация по предприятиям удаленных регионов нашей страны, для которых Интернет часто является единственным средством общения с миром, обычно расположена на региональных серверах и как раз почему-то в базах данных.

И последнее неудобство, докучающее в первую очередь пользователям русскоязычной части Сети, - это ее нестабильность. Меняются адреса, структура сайтов, сами они появляются и исчезают, поэтому не всегда удаётся найти нужную информацию.

К средствам поисковых систем относится язык запросов.

Используя различные приёмы, мы можем добиться желаемого результата поиска.

! – запрет перебора всех словоформ.

+ - обязательное присутствие слов в найденных документах.

- - исключение слова из результатов поиска.

& - обязательное вхождение слов в одно предложение.

~ - требование присутствия первого слова в предложении без присутствия второго.

| - поиск любого из данных слов.

«» - поиск устойчивых словосочетаний.

$title – поиск информации по названиям заголовков.

$anchor – поиск информации по названию ссылок.

Слова, входящие в запрос

Структура запроса

Информационная система

Информационная! Система!

Информационная + система

Информационная - система

«Информационная система»

Персональный компьютер

Персональный компьютер

Персональный & компьютер

$title (Персональный компьютер)

$anchor (Персональный компьютер)