Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб.раб.№8 Поиск инфрмации в сети интернет.doc
Скачиваний:
38
Добавлен:
13.04.2015
Размер:
321.54 Кб
Скачать

Лабораторная работа. Поиск информации вWww Требования к содержанию, оформлению и порядку выполнения

Перед выполнением лабораторной работы необходимо создать папку. В эту папку в ходе выполнения работы необходимо сохранять требуемые Web-страницы.

Лабораторную работу необходимо выполнять согласно своему варианту. Вариант определяем по номеру монитора за которым Вы работаете (нечетные номера– первый вариант, чётные – второй).

Перед выполнением лабораторной работы изучите теоретическую часть, ознакомьтесь со страницами описания поиска в поисковых системах Яndex(http://www.yandex.ru), Rambler (http://www.rambler.ru), АПОРТ (http://www.aport.ru). Задания лабораторной работы необходимо выполнять последовательно, при необходимости сохраняя требуемыеWeb-страницы поиска в свою папку.

Теоретическая часть Особенности поиска информации в Яndex

Яndex поисковая система позволяющая организовать поиск прежде всего в российском Интернете и в доменных зонах республик бывшего СССР. Хотя с помощью Яndex можно легко отыскать и западный сайт, если на него ведет прямая ссылка с од­ной из отечественных страничек.

Яndex приспособлен к особенностям русского языка, в отличие от западных поисковых систем, осуществляющих поиск в российском Интернете. Это проявляется в первую очередь в том, что Яndex различает словоформы, т.е. умеет находить заданные слова независимо от формы, в которой они употребляются в документах. Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Например, если задан запрос «идти», то в результате поиска будут найдены ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т.д.

Яndex, в отличие от большинства поисковых машин, различает регистр букв. Если Вы наберете ключевое слово со строчной буквы, то будут найдены документы, содержащие это слово со строчной так и с прописной буквой. Но если написать слово со строчной буквы, то Яndex найдет страницы, которые содержат искомое слово именно с прописной буквой.

В Яndex при желании можноопределить область поиска,используя переключатель внизу строки поиска (Рис. 1).

Рис. 1. Строка поиска в поисковой системе Яndex.

То есть, Яndexможно указать, где именно искать нужную вам информацию. Помимо категории Везде предлагаются следующие варианты:

  • Каталог

  • Новости

  • Маркет (товары)

  • Энциклопедии

  • Картинки

Кроме простого запроса в Яndex можно осуществить сложный поиск с использованиемязыка поисковых запросов. Причем язык поисковых запросов у Яndex достаточно многогранен. В Яndex, кроме использования общепринятых операторов логических отношений, можно указывать расстояния между словами (расстояние в словах, предложениях, абзацах), назначать словам весовых коэффициентов, ограничивать поиск только фрагментом документа и т.д.

Таблица 1.

Синтаксис языка запросов Яndex.

Синтаксис

Что означает оператор

Пример запроса

пробел или &

логическое И (в пределах предложения)

лечебная физкультура

&&

логическое И (в пределах документа)

рецепты && (плавленый сыр)

|

логическое ИЛИ

фото | фотография | снимок | фотоизображение

+

обязательное наличие слова в найденном документе (работает также в применении к стоп-словам)

+быть или +не быть

( )

группирование слов

(технология | изготовление) (сыра | творога)

~

бинарный оператор И НЕ (в пределах предложения)

банки ~ закон

~~ или -

бинарный оператор И НЕ (в пределах документа)

путеводитель по парижу ~~ (агентство | тур)

!

точная форма

!идти

/(n m)

расстояние в словах (-назад +вперед)

поставщики /2 кофе музыкальное /(-2 4) образование вакансии ~ /+1 студентов

" "

поиск фразы

"красная шапочка" (эквивалентно красная /+1 шапочка)

&&/(n m)

расстояние в предложениях (-назад +вперед)

банк && /1 налоги

$title (выражение)

поиск в заголовке

$title (CompTek)

$anchor (выражение)

поиск в тексте ссылок

$anchor (CompTek | Dialogic)

#keywords=(выражение)

поиск в ключевых словах

#keywords=(поисковая система)

#abstract=(выражение)

поиск в описании

#abstract=(искалка | поиск)

#image="значение"

поиск файла изображения

#image="tort*"

#hint=(выражение)

поиск в подписях к изображениям

#hint=(lenin | ленин)

#url="значение"

поиск на заданном сайте (странице)

#url="www.comptek.ru*"

#link="значение"

поиск ссылок на заданный URL

#link="www.yandex.ru*"

#mime="значение"

поиск в документах данного (pdf или rtf) типа

#mime="pdf"

Рассмотрим подробнее основные операторы поиска Яndex.

Логическое AND(И). Этот оператор подразумевает, что в искомом документе должны обязательно содержаться все слова, которые оператор разделяет в запросе. В принципе логическому «И» соответствует простой пробел между ключевыми словами запроса, но использование + или &, позволяет ужесточить критерии запроса. Например, при запросе «лечебная & физкультура» (эквивалентно запросу «+лечебная +физкультура»), результатом поиска будет список документов, в которых в одном предложении содержатся и слово «лечебная», и слово «физкультура».

Заметим, что двойное & (&&) обозначает логическое «И» в пределах документа, а знак + (как впрочем, и -) в запросе размешаются следующим образом: перед любым из них ставится пробел, а вот с последующим словом они должны находиться в непосредственном соседстве.

Логический оператор NOT (HE) («без»). Подразумевает, что выбраны будут все до­кументы, содержащие слово перед этим оператором, но исключая содержащие слова после него. Обозначается – (~~) (в пределах документа) и ~ (в пределах предложения). Данный оператор идеальный инструмент для сужения поля поиска. Например, по запросу «Москва ~ город» будут найдены все документы, содержащие слово «Москва», рядом с которым (в пределах предложения) нет слова «город».

Логическая оператор OR (ИЛИ), обозначается |.Указывает на то, что в документе должно находиться хотя бы одно сло­во из тех, которые разделяет этот оператор. Например: «расписание график | перечень».

Как и во многих других поисковых машинах в Яndex для построения сложных поисковых выражений можно использовать скобки.

Например: (фотографии | фотокарточки) +(реставрация | восстановление).

Точная форма обозначается знаком!. Используется, когда нужноограничиться лишь одной, конкретной формой данного слова или фразы.

Например, по запросу: «!идти» уже не будут выдаваться документы, в которых содержится словоформа «шел».

Кроме того, Яndex, в отличие от многих других поисковых систем, позволяет осуществлять поиск поточной фразе.Для этого достаточно заключить слова фразы в кавычки. Например, по запросу «информационные технологии», на момент написания этих строк, Яndex выдавал 2 858 973, а по запросу «”информационная технология”» – всего 65 420.

Наконец, при поиске в Яndex, используется ряд дополнительных символов, позволяющих определять, на каком расстоянии друг от друга должны распола­гаться в тексте странички слова, включенные в запрос:

/n где n равно количеству слов-«разделителей»

Так, по запросу: «персональный /3 компьютер» будут найдены все странички, в тексте которых встречаются слова «пер­сональный» и «компьютер», отделенные друг от друга не более чем тремя словами.

Число n можно также дополнить знаками + и - , в зависимости от того, в ка­кую сторону будет вестись отсчет слов-разделителей (вперед и назад соответст­венно). В общем виде ограничение по расстоянию задается при помощи пунктуации вида /(n m), где n минимальное, а m максимально допустимое расстояние. Так запрос «музыкальное /(-2 4) образование» означает, что слово «музыкальное» должно находиться от слова «образование» в интервале расстояний от 2 слов слева до 4 слов справа.

Когда знаки ограничения по расстоянию стоят после двойных операторов, то употребленные там числа - это расстояние не в словах, а в предложениях. Запрос «банк && /1 налоги» означает, что слово «налоги» должно находиться в том же самом, либо в соседнем со словом «банк» предложении.

Остальные операторы позволяют осуществить специальный поиск, в том числе поиск в заголовках страниц, поиск в текстах ссылок, поиск в ключевых словах, поиск в описании, поиск в подписях к изображениям, поиск на заданном сайте (странице), поиск ссылок на заданный URL и т.д.

Расширенный поиск

Сложный поиск в Яndex можно выполнить и без знания операторов. Для этого в Яndex предусмотрена специальная поисковая форма «Расширенный поиск». Воспользоваться ей можно, щелкнув по крестику под кнопкойНайти строки поиска, или набрав в адресной строке браузера следующий URL: http://www.yandex.ru/advanced.html

Форма «расширенного поиска» представляет даже более широкие возмож­ности, чем использование стандартных операторов языка запросов. С её помощью можно уточнить взаиморасположение искомых слов, указать область поиска в документе, ограничить круг поиска страницами, созданными или изме­ненными в пределах заданного временного интервала, уточнить язык докумен­та, исключить из просматриваемой зоны отдельные странички или сайты, или наоборот, искать заданный текст только в их границах.

Рис. 2. Фрагмент страницы расширенного поиска в поисковой системе Яndex.