Добавил:
elohina98@mail.ru Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб. раб.5_Интернет (2 ч.).docx
Скачиваний:
5
Добавлен:
05.05.2019
Размер:
1.35 Mб
Скачать

Область документа

Область документа - это та часть окна браузера Internet Explorer, в которой изображаются страницы системы World Wide Web. При запуске Internet Explorer автоматически загружает документ, который называется начальная страница. Полосы прокрутки помогут вам увидеть не помещающиеся в области документа части страницы. В самой области документа щелчок мышью по связи перенесет вас на другую страницу, а щелчок правой кнопкой мыши выведет на экран меню объекта, вид которого зависит от того, по чему вы щелкнете по связи, по графическому изображению или по фону документа. Загруженная Web-страница может иметь фреймовую структуру, состоящую из нескольких окон.

Строка состояния

При загрузке страниц системы World Wide Web передача информации с сервера Internet на ваш компьютер подчас занимает достаточно много времени. В таком случае весьма полезна информация о том, чем на самом деле занят в данный момент Internet Explorer.

Строка состояния способна сообщить вам определенную информацию о работе Internet Explorer, в частности, адрес Internet, на который указывает данная связь, сведения о том, на каком этапе находится процесс загрузки текущей страницы, и о том, чем именно занят в данный момент Internet Explorer.

В правом углу строки состояния располагается значок, который олицетворяет собой текущую страницу. Если вы ненадолго разместите указатель мыши над этим значком, на экране появится информация о текущей странице. Эта возможность чрезвычайно полезна в тех случаях, когда вы не знаете, чем занимается Internet Explorer.

Работа с браузером Internet Explorer

Переключение кодировок русского языка

«Выберите кодировку...» – эта надпись очень часто встречается на отечественных серверах Web. Исторически получилось так, что локальные кодировки, принятые на компьютерах с разными операционными системами (Windows, UNIX, DOS, Mac), продолжают существовать и в виде сетевых кодировок. Поэтому, если, загрузив какую либо страницу Web, вы видите набор совершенно непонятных символов кириллицы, то это значит, что кодировка на сервере не совпадает с кодировкой, установленной в браузере. В таком случае можно выбрать кодировку на сервере с помощью имеющегося там меню или сменить кодировку у браузера. Второй способ – более универсальный, так как ряд серверов не предоставляет возможности сменить кодировку.

Вообще говоря, за стандартную кодировку русских страниц в Интернете принята так называемая кодировка KOI8-R (которую поддерживают компьютеры под управлением UNIX). Именно она описана в RFC-1489, официальном документе комитета InterNIC (ftp://ds.internic.net/rfc/rfc1489.txt). Однако повсеместное внедрение Windows на ПК и серверов World Wide Web под управлением операционной системы Windows NT составляет «оппозицию» этому стандарту, реализуя «явочным порядком» поддержку кодировки 1251, принятой в различных версиях Windows. Кроме того, в российской части Интернета вы встретите и такие серверы, где документы представлены всего лишь в одной кодировке. Пример одного из узлов, где поддерживается только кодировка Windows 1251 – это узел российского представительства Microsoft (http://www.microsoft.com/rus).

Чтобы изменить кодировку русскоязычной Web-страницы в браузере Internet Explorer, выберите пункт Вид кодировки в меню Вид. Откроется список возможных кодировок, в котором нужно выбрать нужную.  Еще один способ – с помощью локального меню. Для этого, расположив указатель мыши на текстовой части страницы, щелкните правой клавишей мыши. Появится выпадающее меню, где будет пункт Вид кодировки, а далее уже следует выбрать нужную вам кодировку.

Навигация в сети World Wide Web

Браузер Internet Explorer позволяет перемещаться по системе World Wide Web несколькими способами. Вы можете:

  • Перейти к определенной странице, щелкнув по связи.

  • Перейти к определенной странице, указав адрес Internet (URL).

  • Вернуться к тем страницам, которые вы просматривали ранее при помощи команд Вперед и Назад.

  • Через раскрытое поле URL вернуться еще дальше назад, к тем страницам, которые вы когда-то просматривали.

  • В любой момент вернуться к излюбленным страницам, сохранив указатели на эти страницы в инструменте .

Когда вы работаете с сервером World Wide Web, Internet Explorer сохраняет полученную с сервера информацию в буфере, который представляет собой не что иное, как набор дисковых файлов. Впоследствии, когда вы щелкаете мышью по связи или по ярлыку, Internet Explorer заглядывает в этот буфер и выясняет, нет ли там нужной вам страницы. Если эта страница присутствует в буфере, он загружает ее оттуда, а не с сервера Internet.

Если Internet Explorer не обнаруживает нужную страницу в буфере, он связывается с Internet, через один из серверов вашей локальной сети, либо, если Ваша связь с Internet через модем, набирая номер вашего поставщика услуг Internet. Этот процесс называется автоматическим дозвоном (AutoDial) - Internet Explorer автоматически связывается с сетью, если нужная страница находится в Internet.

Переход к другим страницам при помощи связей

Система World Wide Web во многом напоминает систему справки большинства приложений Windows. В тексте подсказки любое подчеркнутое или выделенное слово представляет собой особый объект, щелчок по которому позволяет получить дополнительную информацию. В системе World Wide Web такие объекты называются связями.

Каждая Web-страница может содержать любое количество связей с другими страницами. Связи можно распознать, расположив над ними указатель мыши. Если при перемещении над тем или иным объектом указатель мыши принимает вид руки значит, перед вами связь. Обратите внимание на то, что в такие моменты в строке состояния появляется информация о связи, над которой расположен указатель мыши.

Все, что вам нужно сделать для активизации связи, это щелкнуть по ней мышью. Когда вы это сделаете, Internet Explorer перенесет вас на ту Web-страницу, на которую указывает данная связь.

Одновременный просмотр нескольких документов

Браузер Internet Explorer позволяет открывать новые Web-страницы в новых окнах или в новых вкладках в одном и том же окне. Такая возможность позволяет просматривать одну страницу, в то время как Internet Explorer загружает другую, что чрезвычайно удобно, например, когда вы просматриваете страницы, которые содержат много графических изображений (такие страницы загружаются довольно долго). Если вы хотите воспользоваться такой возможностью, выберите в инструменте Страница команду , введите адрес Internet нужной вам страницы и новая страница будет загружена в новое окно программы Internet Explorer. Новую вкладку в текущем окне можно открыть через контекстное меню ссылки по пункту Открыть в новой вкладке.

После того как вы, щелкнув по какой-то связи, перенесетесь на соответствующую страницу, Internet Explorer запомнит, какой связью вы воспользовались. Когда впоследствии вы вернетесь на исходную страницу, Internet Explorer, желая напомнить вам, что вы уже пользовались этой связью, изменит ее цвет с синего на зеленый.

Переход к конкретной странице World Wide Web

Если вам известен точный адрес нужной Web-страницы, то, работая с программой Internet Explorer, вы можете перейти к этой странице при помощи поля адреса

Поле адреса - это узкое информационное окно, расположенное под панелью инструментов. В его текстовом поле всегда изображается название текущей Web-страницы, однако, вы можете ввести в это текстовое поле любой сетевой адрес. Стоит вам ввести адрес и нажать клавишу <Enter>, Internet Explorer доставит вас к нужной странице. Для того чтобы ввести адрес в текстовое поле панели адреса, сделайте следующее:

  1. Нажмите на клавишу <Tab> или щелкните по полю Адрес. При этом будет выделено содержимое текстового поля.

  2. Введите сетевой адрес той страницы, к которой вы хотите перейти. Адрес должен выглядеть примерно так: http://www.microsoft.com

  3. Нажмите клавишу <Enter>. Тем самым вы отдадите Internet Explorer команду найти нужную вам страницу. Учтите, что страница World Wide Web может откликнуться на посланный Internet Explorer запрос спустя несколько секунд.

Команды Вперед и Назад

Эти команды служат для перехода вперед и назад по последовательности страниц, которые вы просматривали. Браузер Internet Explorer поддерживает список страниц, с которыми вы работали, а эти команды просто осуществляют переход внутри этого списка, позволяя вам перемещаться по тем разделам, которые уже были просмотрены. Действие этих команд хорошо демонстрирует следующий несложный пример:

  1. На первой странице щелкните по любой связи. (Связь - это фрагмент текста или графическое изображение, над которым указатель мыши принимает вид руки.)

  2. Выполните команду Назад щелчком по соответствующей кнопке на панели инструментов. (После того как вы это сделаете, вам будет доступна команда Вперед .

  3. Воспользуйтесь командой Вперед, которая вернет вас на соответствующую страницу.

  4. Щелкнув по кнопке рядом с кнопками , можно выбрать адрес произвольной ссылки из проведенных переходов.

Избранное

Закладки на адреса Интернета, или Избранное как они называются в Internet Explorer, – это очень полезный инструментарий браузера. С их помощью можно заметно облегчить доступ к ранее просмотренным Web- страницам. На диске адреса избранных страниц запоминаются в виде ярлыков – небольших файлов, в которых записан URL данной страницы.

Подписка, каналы и активный рабочий стол – все эти понятия являются различными реализациями так называемой Push-технологии, суть которой состоит в активной доставке информационного содержания на компьютер пользователя. Поскольку доставка информации, или, как ещё называют, контента (от английского Content, содержимое), клиентскими Push-программами происходит в фоновом режиме работы компьютера, и накопленные этими клиентами сведения сохраняются на жестком диске машины. Таким образом, заметно облегчается доступ к интересующей пользователя информации.

 В Internet Explorer последних версий произошло дальнейшее развитие инструментария закладок, традиционно называемых в браузерах Microsoft как Favorites (Избранные страницы). Если до этого, в версиях 2.х – 3.х избранные страницы представляли собой обычную статичную коллекцию адресов (URL) Web-страниц, то теперь появилось два дополнительных уровня, расширяющих это базовое понятие: Подписка и Каналы.

Подписка – это интеграция внутри традиционного браузера функций прежде самостоятельного класса продуктов, – так называемых офф-лайновых браузеров. Задачей офф-лайновых браузеров является копирование в фоновом режиме на жесткий диск содержимого указанных пользователем Web-страниц. Затем отслеживаются все изменения, произошедшие на этих страницах, и при необходимости новое содержимое опять подгружается на диск. Таким образом, создается автоматически обновляемая коллекция полновесных страниц (не URL!), которые пользователь может затем просматривать в автономном режиме, не обращаясь непосредственно к узлам Web.

Каналы в деле доставки информационного содержания идут еще дальше, реализуя Webcasting – показ с помощью браузера специально подготовленных последовательностей гипертекстовых страниц, логически связанных в программы Web-вещания. Технология Web-вещания в Internet Explorer получила специальное название, – «Active Channel», – и имеет специальный формат CDF (Channel Definition File).

Все действия, связанные с работой с избранными страницами и подпиской, осуществляются с помощью инструмента Избранное. При этом вы получаете доступ к избранным страницам и средствам их создания и организации.

Обычно адреса избранных страниц удобно группировать по тематическим папкам, и первоначально в меню Избранное уже присутствуют несколько стандартных папок с заранее записанными адресами:  это папки Каналы, Ссылки, Обновление приложений. Сами адреса избранных страниц представлены ярлыками с названиями документов, которые были даны им авторами этих страниц. Операционная система Windows 95 или Windows 98 размещает ярлыки избранных страниц в виде файлов с расширением .url.

Журнал

Командами Вперед и Назад пользоваться легко и просто, но чем больше страниц вы просмотрите, тем труднее будет помнить, на сколько шагов назад надо вернуться для того, чтобы попасть на нужную страницу. Internet Explorer предоставляет в ваше распоряжение весьма полезное средство - Журнал, при помощи которого вы легко сможете вернуться сразу на несколько шагов назад.

Каждый раз, когда вы заглядываете на какую-то страницу, Internet Explorer помещает ярлык этой страницы в папку под названием Журнал. Вы можете ознакомиться с содержимым этой папки при помощи вкладки Журнал инструмента Избранное.

Эта вкладка открывает окно Журнал, которое показывает содержимое папки Журнал, в которой содержатся ярлыки последних трехсот просмотренных страниц. Для перехода к одной из них сделайте двойной щелчок по соответствующему значку.

Значки папки Журнал, являясь ярлыками Web-страниц, содержат информацию, которая необходима браузеру Internet Explorer для поиска нужной страницы. Когда вы делаете двойной щелчок по ярлыку, Internet Explorer сначала пытается отыскать эту страницу в своем буфере, а если она там отсутствует, устанавливает соединение с сетью и доставляет ее.

Печать Web-страницы

Браузер Internet Explorer позволяет распечатать любую Web-страницу. Печать можно реализовать с использованием кнопки Печать на панели инструментов.

Этот способ целесообразно использовать при печати всей Web-страницы. При этом для печати достаточно нажать кнопку на панели инструментов. После того как вы нажмете на кнопку, браузер сам скомпонует вид документа на бумаге, разделит его на печатные страницы и выведет на ваш принтер. Обратите внимание, что на каждом напечатанном листе в качестве колонтитула будет присутствовать URL данного документа. Это поможет вам вспомнить, с какого узла был получен данный документ и вернуться туда при необходимости.

Для печати фрагментов Web-страницы необходимо выбрать в инструменте Печать опцию , которая откроет диалоговое окно Печать (рис. 14), в котором необходимо задать параметры печати.

Рис. 13

В окне можно сделать установки требуемой печати. Эта команда очень удобна в тех случаях, когда надо просмотреть много текстовой информации или когда вы намерены ознакомиться с какой-то страницей, находясь вдали от компьютера. В Internet Explorer существует несколько дополнительных функций:

  • если Web-страница разбита на фреймы, то можно напечатать каждый фрейм отдельно, или все вместе (в том числе каждый – на отдельном листе),

  • если вы хотите, чтобы в конце документа была напечатана таблица с URL всех ссылок, присутствующих в данном документе, то установите флажок Печать таблицы ссылок.

  • и, наконец, можно распечатать даже все документы, на которые ведут ссылки с данной страницы (на текущем или любом ином узле Web), получив, таким образом, подробное «видение» темы, которой посвящена данная страница. Для этого следует установить флажок Печать связанных документов.

Сохранение Web-страницы на диск

Программа Internet Explorer позволяет записать любую Web-страницу на диск в виде файла. При этом следует иметь в виду, что, поскольку документы World Wide Web создаются с использованием специализированного языка HTML, при сохранении страницы надо понимать, в каком формате вы хотите записать ее на диск. При помощи команды Сохранить как из меню инструмента Страница вы можете сохранить Web-страницу в одном из двух форматов - текстовом или HTML.

При записи страницы на диск в формате HTML будут сохранены все коды форматирования, однако для просмотра такой страницы понадобится специальная программа просмотра документов World Wide Web, например браузер Internet Explorer. Если вы сохраните страницу в текстовом виде, информация о форматировании будет утеряна, зато вы сможете загрузить получившийся текст практически в любое приложение.

Перекачивание файлов из Internet

Некоторые серверы World Wide Web позволяют перекачивать по сети Internet файлы на ваш компьютер. Обычно Internet Explorer изображает такие файлы в виде связей. Для того чтобы загрузить файл, щелкните по соответствующей связи. Как только вы это сделаете, Internet Explorer выведет на экран диалоговое окно Сохранение документа, в котором вы сможете указать, куда должен быть записан данный файл.

Перетаскивание рисунков и текста

Работая с программой Internet Explorer, вы можете перетаскивать графические изображения и фрагменты текста из области документа и опускать их на Рабочий стол или в документы других приложений. Допустим, к примеру, что перед вами Web-страница, и вам понравился находящийся на ней рисунок, который вы хотите скопировать в файл и поместить этот файл на Рабочий стол. Для этого сделайте следующее:

  1. Убедитесь в том, что окно Internet Explorer не развернуто на весь экран и что на экране виден хотя бы небольшой кусочек Рабочего стола.

  2. Расположите указатель мыши над понравившимся рисунком и нажмите левую кнопку мыши.

  3. Переместите указатель мыши так, чтобы он расположился над поверхностью Рабочего стола. При перемещении мыши вид указателя должен измениться.

  4. Когда указатель мыши окажется над Рабочим столом, отпустите кнопку мыши. При этом на Рабочем столе должен появиться значок, олицетворяющий изображение, которое вы только что скопировали.

Вы можете перетаскивать рисунки не только на Рабочий стол. Их можно перетаскивать практически в любые приложения, которые способны работать с изображениями.

Точно так же можно перетаскивать и фрагменты текста. Само собой разумеется, что вы можете перемещать информацию и через буфер обмена — стандартные команды Вырезать, Копировать и Вставить присутствуют в меню инструмента Страница Internet Explorer.

Поиск в Internet

Одно из достоинств Internet, вызвавшее его бурное развитие, это большое количество разнообразной информации, помещаемой на Web-страницах. Система World Wide Web обеспечивает доступ к Web-серверам, на которых находятся Web-страницы, оставляя пользователям самим находить URL Web-страницы, на которой находится нужная информация. Поиск нужной информации в Web осуществляется специальными программами, называемыми поисковыми системами. Поиск в Web – это во многом искусство, основанное на знании самой Сети, возможностях поисковых систем и в значительно меньшей степени – на возможностях конкретного браузера. Тем не менее, поскольку умение правильно применять существующие инструменты – основа любого искусства, рассмотрим те функции по поиску в Web, которые встроены прямо в интерфейс Internet Explorer. В браузер встроен инструмент, подключающий для поиска поисковую машину Google. Поиск реализуется набором текста контекстного поиска в строке поиска. Например, находясь на главной странице загруженного в браузер Web-сайта irk.ru мы в строке поиска набираем поиск «браузер internet explorer». После завершения поиска открывается окно поисковой системы Google, в котором появляются ссылки на сайты, содержащие на своих страницах контекст «браузер internet explorer». По этим ссылкам можно найти необходимую при поиске информацию.

Рис.20

Кроме Google, браузер может подключить для поиска одну из поисковых систем:

  • Rambler (русский Web-индекс и каталог);

  • Bing (русский Web-индекс и каталог);

  • Апорт! (русский Web-индекс);

  • Яndex (русский Web-индекс);

  • Alta Vista (международный Web-индекс);

  • Lycos (международная система поиска с индексом и каталогом);

  • Excite (международный Web-индекс).

Для подключения выбранной поисковой системы необходимо в окне подключения поисковой системы выбрать поисковую систему и другие параметры поиска.

Рис.21

Преимущество такой панели поиска – вы можете отправить запрос на несколько серверов с одной страницы, значительно экономя время на том, что не надо загружать заглавные страницы этих поисковых серверов друг за другом. Подобные средства, обеспечивающие доступ сразу к нескольким поисковым системам (типа рассмотренной панели в Internet Explorer с доступом к нескольким серверам), называются мета поисковыми средствами поиска.

К сожалению, подобные средства мета поиска отнюдь не свободны от недостатков. Главный из них состоит в том, что мета-поиск на поддерживаемых серверах осуществляется по наиболее упрощенной методике (Simple Search). Это связано с тем, что каждая поисковая система имеет свой набор дополнительных опций по сужению области поиска, применению булевых операторов и т. д. Естественно, что в случае «простого поиска» (Simple Search) из «поля зрения» выпадают документы, которые могли бы быть найдены при более тщательном поиске «продвинутыми» средствами конкретного сервера.

В общем случае, чтобы улучшить результаты поиска при работе с мета поисковыми сервисами, можно порекомендовать вначале выбрать один или несколько поисковых серверов, которые нашли наибольшее количество документов. Затем отдельно загрузить уже заглавные страницы этих серверов и в качестве следующего шага провести отдельный тщательный поиск с помощью уже только этих серверов. О том, как пользоваться средствами сложного поиска (Advanced Search) на каждом конкретном сервере, можно узнать, если обратиться к справке (обычно это оформлено в виде кнопки Help) по методике проведения сложного поиска на данном сервере.

Итак, чтобы вызвать поисковую страницу браузера Internet Explorer, проделайте следующее:

  1. Вызовите панель поиска, щелкнув кнопку Поиск на панели инструментов.

  2. Выберите сервер, с которым вам хотелось бы поработать.

  3. Введите какое-нибудь интересующее вас слово в окне для ввода ключевых слов и нажмите на кнопку Поиск, которая изображена на этой Web-странице рядом с окном ввода текста. В результате обработки запроса выбранный вами поисковый сервер возвратит список аннотаций найденных документов. Полученные ссылки на найденные документы можно прочесть на правой половине окна.

Большинство пользователей при работе с поисковыми системами даже не догадываются о существовании особого языка, специально разработанного для поисковых запросов. Обычно человек, ищущий что-то во всемирной паутине, просто набирает в поисковой строке набор подходящих слов, не сильно задумываясь о правилах морфологии. В принципе возможностей стандартного общего поиска хватает для повседневных запросов, однако для более точного и быстрого нахождения информации целесообразно использовать язык запросов. Язык, на котором формулируются запросы к поисковым системам, называется языком поисковых запросов или информационно-поисковым языком.

В различных поисковых системах язык запросов может различаться, однако обычно он является некоторым подобием языка регулярных выражений с дополнениями, связанными со спецификой работы той или иной поисковой системы. Знание и правильное применение языка запросов конкретной поисковой машины улучшает и упрощает пользователю процесс поиска информации.

Язык поисковых запросов состоит из логических операторов, префиксов обязательности, возможности учёта расстояния между словами, морфологии языка, регистра слов, расширенных операторов, возможностей расширенного поиска, уточнения поиска.

Специальные символы

Оператор

Описание

"

Обнаруживает точные слова в кавычках или фразы

|

Найти любое из слов. Достаточно поставить между словами символ |, и вы получите страницы, где содержится хоть одно из слов запроса.

~~

Исключает страницы, содержащие слово или фразу.

()

Вы можете строить сколь угодно сложные конструкции, подставляя в каждом из операторов вместо отдельного слова целые выражения. Чтобы Google при этом правильно понимал вас, заключайте выражения в круглые скобки.

&

Ограничить поиск страницами, где слова запроса находятся в пределах предложения

&&

Если вам нужны документы, где присутствуют заданные слова — неважно, на каком расстоянии и в каком порядке — соедините их оператором

!

Слова с большой и маленькой буквы считаются разными формами одного слова, поэтому все равно, какой регистр использовать в запросе. Исключением является оператор точной формы. Это полезно, если искомое имя собственное совпадает с распространенным словосочетанием, например, группа !Черный кофе. Все слова, которые вы приводите в запросе, по умолчанию ищутся с учетом морфологии. Чтобы отключить ее, используйте оператор ! перед словом (без пробела).

/

Вы можете указать максимально допустимое расстояние между двумя любыми словами запроса, поставив после первого слова символ /, сразу за которым идет число, означающее расстояние.

При задании поиска с использованием языка запросов необходимо соблюдать следующие рекомендации:

  • Морфология учитывается, т.е. независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. Например, если задан запрос «идти», то в результате поиска будут найдены ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т.д.

  • Если вы хотите найти точную цитату, просто задайте искомую фразу в кавычках: закрой свои бледные ноги". По такому запросу будут найдены все страницы, в которых есть нужная вам цитата.

  • Слова с большой и маленькой буквы считаются разными формами одного слова, поэтому все равно, какой регистр использовать в запросе. Исключением является оператор точной формы. По запросу '!иванов' будут найдены все документы, содержащие эту словоформу в любом регистре, а по запросу '!Иванов' — только документы, в которых имеется форма 'Иванов' с большой буквы. Это полезно, если искомое имя собственное совпадает с распространенным именем нарицательным, например, село !Кошки или !Прост.

  • Чтобы отобрать документы, где определенное слово присутствует обязательно, поставьте перед ним плюс (без пробела). Поэтому, если вас интересует цитата из «Гамлета», вы можете задать запрос +быть +или +не быть. Маленькая хитрость: тот же результат можно достичь, задав «обязательные» слова в кавычках: "быть или не быть".

  • Чтобы исключить документы, в которых встречается определенное слово, поставьте перед этим словом два символа тильды или один минус (без пробела). Например, если вам нужно описание Парижа, а не предложения многочисленных турагентств, задайте запрос путеводитель по Парижу ~~агентство ~~тур. Или запрос путеводитель по Парижу -агентство –тур

  • Стоп-слова. В любом языке есть слова, которые встречаются намного чаще других. Слова, которые встречаются слишком часто, чтобы быть значимыми для поиска, называются стоп-словами. Как правило, это местоимения, предлоги и частицы. Поисковые машины обычно игнорируют стоп-слова, даже если они встречаются в тексте запроса.

  • Для запросов из нескольких слов, Google умеет определять, на каком максимальном расстоянии должны быть слова запроса, чтобы страница лучше всего отвечала на запрос. Вы можете указать требования к расстоянию в явном виде.

Слова идут подряд.

Такой порядок слов можно указать с помощью запроса в кавычках.

Пример

По запросу "красная шапочка" будут найдены страницы, где есть подряд два слова: вначале красная, затем шапочка.

Слова в одном предложении.

Ограничить поиск страницами, где слова запроса находятся в пределах предложения, вы можете, соединив слова оператором &.

Пример

Запрос культура & Китая найдет страницы, где есть сочетания слов культура Древнего Китая или Китай и его культура.

Слова в одном документе.

Если вам нужны документы, где присутствуют заданные слова — неважно, на каком расстоянии и в каком порядке — соедините их оператором &&.

Пример

По запросу продажа & сканеров && Новосибирск найдутся страницы, где в одном предложении должны встретиться слова продажа и сканеры, и где угодно на странице должно быть слово Новосибирск.

  • Вы можете указать Google найти любое из заданных слов. Это полезно, например, когда для нужного вам термина есть много синонимов. Достаточно поставить между словами символ |, и вы получите страницы, где содержится хоть одно из слов запроса.

Пример

Запрос аэроплан | самолет | планер | дирижабль | аэростат | вертолет | пепелац найдет страницы, где встречается хоть одно из этих слов.

  • Яндекс позволяет исключать страницы, где есть определенные слова. Для этого используется оператор ~~, слева от которого вы пишите «что искать», а справа - какие страницы исключать из поиска.

Пример

Если вы ищете информацию о Ливанове (но не министре), можете задать запрос Ливанов ~~ министр. Будут найдены все страницы, где есть слово Ливанов и нет слова министр.

Иногда допустимо, чтобы слово встречалось на странице, но нельзя, чтобы оно встретилось в том же предложении. С этой целью используйте оператор ~.

Пример

Если вы ищите информацию о г-же Кузькиной, то более информативные результаты даст запрос Кузькина ~ мать, который ищет страницы со словом Кузькина, исключая страницы, где в одном предложении с ним есть слово мать.

  • Вы можете строить сколь угодно сложные конструкции, подставляя в каждом из операторов вместо отдельного слова целые выражения. Чтобы Google при этом правильно понимал вас, заключайте выражения в круглые скобки.

Пример

Если вы ищете описание мумие, но не хотите наталкиваться на прайсы интернет-магазинов, можете задать такой запрос: мумие && (лечение | лечебный | болезни)~~(цена | прайс | рубли | доллар | фирма | магазин). Будут найдены все страницы, где есть слово мумие, а также любое из слов лечение, лечебный или болезни, и нет ни одного из слов, перечисленных после оператора ~~.

  • Все слова, которые вы приводите в запросе, по умолчанию ищутся с учетом морфологии. Чтобы отключить ее, используйте оператор ! перед словом (без пробела).

Пример

Запрос !день найдет страницы, где слово день встречается только в такой форме.

Если одна или несколько форм слова совпадает с другими словами, поиск может находить лишние страницы. Указав нормальную форму слова с помощью оператора !!, вы уберете многие из ненужных страниц.

Пример

Запрос !!день найдет все формы слова - дня, дню, днем и др., и не найдет форм слова деть (одна из которых совпадает со словом день).

Независимо от формы слов, Google по-разному учитывает слова, набранные с маленькой и большой буквы.

Характеристика поисковых систем

Rambler, http://www.rambler.ru

Поисковая система Rambler (Рамблер) была изначально создана в фирме «Стек» для возможности поиска по русскоязычным серверам. Компания «СТЕК» образовалась в Научном Центре Биологических Исследований в г. Пущино (Московская область) в 1991 г., а автором поисковой системы является Дмитрий Крюков.

Рамблер – единственный в российском Internet (Рунет) портал, объединивший поисковую систему, рейтинг-классификатор, а также ряд бесплатных сервисов и информационных проектов. Ресурсы портала регистрируют ежесуточно более 3,5 млн. посещений, а ежемесячная аудитория Рамблера составляет 60-70% всех пользователей Рунета.

Только поисковая система содержит информацию о более чем 12 миллионах документов, расположенных на серверах России и стран СНГ. Рамблер обрабатывает ежесуточно не менее 500 тысяч поисковых запросов (в среднем – 5 запросов в секунду), сканируя 48 тысяч Web-серверов и используя несколько одновременно работающих программ-роботов. Все проекты Интернет-холдинга реализованы на базе собственных технологических разработок.

Поисковая система Рамблер поддерживает различные логические операции между словами, а также усечения слов с помощью метасимволов. Пользователь может определить выходной формат документов, максимальное количество результатов поиска и т. д.

Яndex,  http://www.yandex.ru

Эта поисковая система Internet – часть проекта фирмы Comptek по разработке набора средств полнотекстовой индексации и поиска в текстовых данных с учетом морфологии русского языка. Яndex (произносится как «яндекс») расшифровывается как Языковый Индекс или, в английском написании, YandexYet Another Index.

Как указывается в документе на сервере, продукты Яndex предназначены для работы с большими объемами русских текстов всех типов – в виде файлов различных форматов, полей баз данных и Web-страниц.

Поисковая машина Яndex была запущена в эксплуатацию в конце сентября 1997 г. и область поиска системы – русскоязычный Internet. Отличительные особенности системы, в соответствии с описанием на http://yandex.ru:

  • полнотекстовый поиск с полным учетом морфологии русского и английского языков;

  • мощный язык запросов (в том числе возможность поиска с расстоянием);

  • возможность запроса на естественном языке;

  • корректная обработка сленговых слов;

  • возможность поиска похожего документа;

  • очень компактный индекс;

  • подсветка слов из запроса в найденных документах;

  • развитая релевантность, позволяющая найти искомую информацию, не перегружая пользователя тысячами ссылок на не нужные документы;

  • высокая скорость поиска.

Как работает Яndex.

Система просматривает все указанные ей тексты, преобразует каждое русское слово в нормальную форму (для существительных – это именительный падеж единственного числа, для глаголов – неопределенная форма и т.д.) и запоминает подробный адрес каждого слова. Алгоритмы морфологического разбора, которыми мы занимаемся, позволяют проанализировать слово, определить его характеристики и найти все формы, например: идти – идешь – шел; ребенок – дети; окно – окон; отзывать – отозвали.

Яndex обеспечивает индексацию одновременно с морфологическим разбором. Это позволяет создавать компактный индекс – около 30% исходных текстов, сохраняя достаточно высокую скорость индексации – 1-2 Мб/мин. Такая технология дает возможность почти полного снятия омонимии на этапе индексации.

Морфология базируется на словаре из 90 тыс. слов, к которому добавлены алгоритмы словообразования, а также на механизме построения гипотез для слов, отсутствующих в словаре. Создан и пополняется словарь имен собственных.

Русский интерфейс к поисковой системе AltaVista

Работу морфологии Яndex можно использовать не только на самом поисковом сервере Яndex, но и на примере русского поиска с помощью системы AltaVista (http://www.comptek.ru/alta.html). Как известно, слова в AltaVista проиндексированы просто как последовательность символов, что заставляет пользователя при поиске специально думать о том, как русские слова изменяются при склонениях и спряжениях. При запросе же через Яndex в запрос системы автоматически подставляются все допустимые формы требуемых слов.

Апорт!  http://www.aport.ru

Поисковая система Апорт! – это проект фирмы Агама при поддержке российского отделения Intel. Система задумана и реализована как Web-индекс для осуществления поиска в Российской части Интернета, на русскоязычных серверах СНГ и мирового Интернета.

Многие Web-сайты, состоящие из множества Web-страниц имеют собственные поисковые системы, осуществляющие поиск информации среди документов сайта. Такие поисковые системы работают по тем же алгоритмам, что и общепринятые поисковые системы. Например сайт ИрГСХА имеет собственную поисковую систему (рис. 22).

Рис.22