Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
lab2.doc
Скачиваний:
13
Добавлен:
13.04.2015
Размер:
85.5 Кб
Скачать

2.2.2 Правила поиска информации в интернете

Обратиться к любой поисковой службе можно и самостоятельно, указав ее адрес. Чтобы, к примеру, воспользоваться популярной поисковой машиной Yahoo!, можно открыть Web-страницу по адресу http://www.yahoo.com/.

Другие популярные специализированные поисковые серверы:

AltaVista (www.altavista.com), excite - (www.excite.com), Google - (www.google.com), Lycos - (www.lycos.com), HotBot - (www.hotbot.com), CNET Search - (www.search.com), MSN Internet Search -(www.search.msn.com)

Netscape Search - -(www.search.netscape.com), Direct Hit -(www.directhit.com)

Простой поиск

Как правило, запрос представляет собой одно или несколько слов, например:

быстрый поиск информации

По такому запросу Вы получите документы, в которых встречаются все слова запроса.

Исключение составляют союзы, предлоги, междометия и т.п. Эти слова (так называемые стоп- слова) можно не писать в запросе, поскольку сами по себе они не несут смысловой нагрузки и будут проигнорированы. Например, по запросу:

погода в Крыму

будут найдены все документы, в которых встречаются одновременно два слова: "погода" и "Крым". Где именно в документе расположены слова, в какой грамматической форме они находятся -- не важно. Слово "в", являющееся предлогом, игнорируется. Так что приведенный запрос можно написать и так:

Крым в погоде

или

погода Крым

Результат поиска будет такой же, как и в первом случае.

Обратите внимание на следующее свойство поисковой машины: независимо от того, в какой грамматической форме Вы пишете слово в запросе, оно находится в документах во всех своих формах. К примеру, по запросу:

ребенок шел

будут найдены среди прочих и документы, содержащие текст "дети идут". Такое распознавание форм работает для базовой лексики, т.е. обычных слов русского/украинского языков, а для каких-либо специфических слов, терминов, неологизмов оно не сработает.

Расширенный поиск

Разница между простым и расширенным способами поиска в том, что при расширенном поиске используются группы операторов, которые позволяют точно указать, каким образом должны быть связаны между собой слова запроса, указать расстояние между ними и т.д.

Синтаксис запросов расширенного поиска различен в разных системах.

Первая группа -- это логические операторы.

Оператор

Синоним

Описание

И

AND ТА & +

Логическое И подразумевается, его можно опускать, т.е. запрос

нужная информация

полностью эквивалентен запросу

нужная и информация.

По любому из этих запросов будут найдены документы, содержащие оба слова.

ИЛИ

OR АБО |

Логическое ИЛИ позволяет искать документы, содержащие хотя бы одно из слов в запросе. Так, по запросу

быстрый или поиск

будут найдены документы, содержащие любое из указанных слов или оба слова одновременно.

НЕ

NOT -

Логическое НЕ ограничивает поиск документами, не содержащими слово, указанное после оператора. Так, по запросу

напиток не кофе

будут найдены документы, содержащие слово "напиток", но не содержащие слово "кофе".

( )

Круглые скобки задают порядок действия логических операторов. Например, Вы вводите запрос

быстрый или качественный поиск.

По такому запросу Вы получите документы, содержащие либо слово "быстрый", либо слова "качественный поиск" (поскольку оператор И подразумевается и действует первым). Если же Вы напишете запрос

(быстрый или качественный) поиск,

то получите документы, где встречаются одновременно слова "быстрый поиск", либо "качественный поиск".

Вторая группа операторов позволяет задать расстояние между словами запроса.

" "

Двойные кавычки позволяют находить словосочетание, указанное в них, либо близкое к нему.

Последняя оговорка связана с двумя обстоятельствами. Во-первых, стоп- слова (предлоги, союзы и т.п.) в кавычках игнорируются, как и в обычном запросе. Во-вторых, грамматическая форма слов также кавычками не фиксируется. К примеру по запросу "погода в Крыму" будут найдены документы, содержащие следующие словосочетания:"погода в Крыму", "погода и Крым", "погода над Крымом", "погода Крым" и т.п.

сл2(...)

с2(...) w2(...) [2,..]

Ограничение расстояния в словах (двойка указана как пример). Если вы хотите потребовать, чтобы заданные вами слова встречались, скажем, в пределах 5 слов, то надо написать: сл5(солнце ветер вода). При этом будут найдены документы, где между словами "солнце", "ветер" и "вода" стоит не более двух других слов (то есть общее число слов во фрагменте не более 5). Порядок, в котором встречаются заданные слова не важен.

пр2(...)

п2(...)

s2(...)

{2,...}

Ограничение расстояния в предложениях (двойка указана как пример). Если вы хотите потребовать, чтобы заданные вами слова встречались, скажем, в пределах одного предложения, то надо написать: пр1(солнце ветер вода).

Еще один распространенный случай -- поиск по адресам Web-серверов.

Оператор url= (url:)Ограничение поиска одним или несколькими серверами, или даже частью сервера. Вот несколько примеров.

Запрос url=www.kharkiv.com

По этому запросу будут выданы все документы, проиндексированные машиной на сервере www.kharkiv.com. В этом случае документы выдаются в случайном порядке.

Запрос url=www.kharkiv.com & справочная & информация

По этому запросу будут выданы все документы, сервера www.kharkiv.com, содержащие слова "справочная" и "информация".

Запрос: url=*.kharkiv.com

По этому запросу будут выданы все документы, проиндексированные машиной на серверах kharkiv.com, users.kharkiv.com и т.д. Запросы такого типа могут обрабатываться довольно долго. Не стоит давать запрос типа *.uа, так как выдача нескольких сот тысяч документов не поможет Вам найти нужную информацию, а система может и вообще "раздумать" возвращать Вам результаты поиска.

* Оператор усечения.Звездочка в конце слова заменяет произвольное число любых букв. Так, по запросувол*помимо "вола" будут найдены документы, содержащие слова"воля", "волна", "волшебник", "Волынь", "вольт"и другие в любой грамматической форме.

! Оператор нормальной формы. Иногда некоторые формы разных слов совпадают по написанию. К примеру, слово "лада" -- это нормальная форма существительного женского рода и родительный падеж слова "лад".

Чтобы снять подобную неоднозначность, Вы можете поставить перед словом в запросе восклицательный знак (!). Тем самым Вы подчеркиваете, что это нормальная форма, и отсекаете некоторую часть ненужных словоформ и как-то ограничиваете выдачу результатов.

Так, по запросу !ладне будет находиться словоформа "ладой", имеющаяся только у существительного женского рода "лада".

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]