- •Лабораторная работа. Поиск информации вWww Требования к содержанию, оформлению и порядку выполнения
- •Теоретическая часть Особенности поиска информации в Яndex
- •Поисковая система Rambler
- •Поисковая система Апорт.
- •Сводная таблица поисковых операторов Яndex, Rambler, Апорт.
- •Общая постановка задачи
- •Список индивидуальных данных
- •Задание 1.
- •Задание 2.
- •Задание 3.
- •Задание 1.
- •Задание 2.
- •Задание 3.
- •Итоговое задание
- •Контрольные вопросы к защите
Лабораторная работа. Поиск информации вWww Требования к содержанию, оформлению и порядку выполнения
Перед выполнением лабораторной работы необходимо создать папку. В эту папку в ходе выполнения работы необходимо сохранять требуемые Web-страницы.
Лабораторную работу необходимо выполнять согласно своему варианту. Вариант определяем по номеру монитора за которым Вы работаете (нечетные номера– первый вариант, чётные – второй).
Перед выполнением лабораторной работы изучите теоретическую часть, ознакомьтесь со страницами описания поиска в поисковых системах Яndex(http://www.yandex.ru), Rambler (http://www.rambler.ru), АПОРТ (http://www.aport.ru). Задания лабораторной работы необходимо выполнять последовательно, при необходимости сохраняя требуемыеWeb-страницы поиска в свою папку.
Теоретическая часть Особенности поиска информации в Яndex
Яndex поисковая система позволяющая организовать поиск прежде всего в российском Интернете и в доменных зонах республик бывшего СССР. Хотя с помощью Яndex можно легко отыскать и западный сайт, если на него ведет прямая ссылка с одной из отечественных страничек.
Яndex приспособлен к особенностям русского языка, в отличие от западных поисковых систем, осуществляющих поиск в российском Интернете. Это проявляется в первую очередь в том, что Яndex различает словоформы, т.е. умеет находить заданные слова независимо от формы, в которой они употребляются в документах. Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Например, если задан запрос «идти», то в результате поиска будут найдены ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т.д.
Яndex, в отличие от большинства поисковых машин, различает регистр букв. Если Вы наберете ключевое слово со строчной буквы, то будут найдены документы, содержащие это слово со строчной так и с прописной буквой. Но если написать слово со строчной буквы, то Яndex найдет страницы, которые содержат искомое слово именно с прописной буквой.
В Яndex при желании можноопределить область поиска,используя переключатель внизу строки поиска (Рис. 1).
Рис. 1. Строка поиска в поисковой системе Яndex.
То есть, Яndexможно указать, где именно искать нужную вам информацию. Помимо категории Везде предлагаются следующие варианты:
Каталог
Новости
Маркет (товары)
Энциклопедии
Картинки
Кроме простого запроса в Яndex можно осуществить сложный поиск с использованиемязыка поисковых запросов. Причем язык поисковых запросов у Яndex достаточно многогранен. В Яndex, кроме использования общепринятых операторов логических отношений, можно указывать расстояния между словами (расстояние в словах, предложениях, абзацах), назначать словам весовых коэффициентов, ограничивать поиск только фрагментом документа и т.д.
Таблица 1.
Синтаксис языка запросов Яndex.
|
Рассмотрим подробнее основные операторы поиска Яndex.
Логическое AND(И). Этот оператор подразумевает, что в искомом документе должны обязательно содержаться все слова, которые оператор разделяет в запросе. В принципе логическому «И» соответствует простой пробел между ключевыми словами запроса, но использование + или &, позволяет ужесточить критерии запроса. Например, при запросе «лечебная & физкультура» (эквивалентно запросу «+лечебная +физкультура»), результатом поиска будет список документов, в которых в одном предложении содержатся и слово «лечебная», и слово «физкультура».
Заметим, что двойное & (&&) обозначает логическое «И» в пределах документа, а знак + (как впрочем, и -) в запросе размешаются следующим образом: перед любым из них ставится пробел, а вот с последующим словом они должны находиться в непосредственном соседстве.
Логический оператор NOT (HE) («без»). Подразумевает, что выбраны будут все документы, содержащие слово перед этим оператором, но исключая содержащие слова после него. Обозначается – (~~) (в пределах документа) и ~ (в пределах предложения). Данный оператор идеальный инструмент для сужения поля поиска. Например, по запросу «Москва ~ город» будут найдены все документы, содержащие слово «Москва», рядом с которым (в пределах предложения) нет слова «город».
Логическая оператор OR (ИЛИ), обозначается |.Указывает на то, что в документе должно находиться хотя бы одно слово из тех, которые разделяет этот оператор. Например: «расписание график | перечень».
Как и во многих других поисковых машинах в Яndex для построения сложных поисковых выражений можно использовать скобки.
Например: (фотографии | фотокарточки) +(реставрация | восстановление).
Точная форма обозначается знаком!. Используется, когда нужноограничиться лишь одной, конкретной формой данного слова или фразы.
Например, по запросу: «!идти» уже не будут выдаваться документы, в которых содержится словоформа «шел».
Кроме того, Яndex, в отличие от многих других поисковых систем, позволяет осуществлять поиск поточной фразе.Для этого достаточно заключить слова фразы в кавычки. Например, по запросу «информационные технологии», на момент написания этих строк, Яndex выдавал 2 858 973, а по запросу «”информационная технология”» – всего 65 420.
Наконец, при поиске в Яndex, используется ряд дополнительных символов, позволяющих определять, на каком расстоянии друг от друга должны располагаться в тексте странички слова, включенные в запрос:
/n где n равно количеству слов-«разделителей»
Так, по запросу: «персональный /3 компьютер» будут найдены все странички, в тексте которых встречаются слова «персональный» и «компьютер», отделенные друг от друга не более чем тремя словами.
Число n можно также дополнить знаками + и - , в зависимости от того, в какую сторону будет вестись отсчет слов-разделителей (вперед и назад соответственно). В общем виде ограничение по расстоянию задается при помощи пунктуации вида /(n m), где n минимальное, а m максимально допустимое расстояние. Так запрос «музыкальное /(-2 4) образование» означает, что слово «музыкальное» должно находиться от слова «образование» в интервале расстояний от 2 слов слева до 4 слов справа.
Когда знаки ограничения по расстоянию стоят после двойных операторов, то употребленные там числа - это расстояние не в словах, а в предложениях. Запрос «банк && /1 налоги» означает, что слово «налоги» должно находиться в том же самом, либо в соседнем со словом «банк» предложении.
Остальные операторы позволяют осуществить специальный поиск, в том числе поиск в заголовках страниц, поиск в текстах ссылок, поиск в ключевых словах, поиск в описании, поиск в подписях к изображениям, поиск на заданном сайте (странице), поиск ссылок на заданный URL и т.д.
Расширенный поиск
Сложный поиск в Яndex можно выполнить и без знания операторов. Для этого в Яndex предусмотрена специальная поисковая форма «Расширенный поиск». Воспользоваться ей можно, щелкнув по крестику под кнопкойНайти строки поиска, или набрав в адресной строке браузера следующий URL: http://www.yandex.ru/advanced.html
Форма «расширенного поиска» представляет даже более широкие возможности, чем использование стандартных операторов языка запросов. С её помощью можно уточнить взаиморасположение искомых слов, указать область поиска в документе, ограничить круг поиска страницами, созданными или измененными в пределах заданного временного интервала, уточнить язык документа, исключить из просматриваемой зоны отдельные странички или сайты, или наоборот, искать заданный текст только в их границах.
Рис. 2. Фрагмент страницы расширенного поиска в поисковой системе Яndex.