Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
el00_03.doc
Скачиваний:
42
Добавлен:
03.05.2015
Размер:
4.84 Mб
Скачать

3.2.2. Система адресации в Интернете

Интернет в целом и, в частности, Всемирная паутина (World Wide Web) имеют стройную систему адресации, обеспечивающую точную идентификацию каждого входящего в Сеть узла путем присвоения ему оригинального адреса, имеющего числовой вид. Подобный код, называемый IP-адресом, выглядит как 195.218.218.38 или 193.124.148.65, что позволяет обозначить все параметры, начиная от страны и заканчивая персональным компьютером каждого пользователя.

Однако большую известность имеет DNS (Domain Name System - система доменных имен). Ее задотаг-- обеспечить уникальность каждого адреса в Сети без необходимости запоминания чисел. Именно сервер DNS производит преобразование символьных (буквенных) адресов в числовые. Система образования доменных имен также логична и проста. Адрес любого web-cepeepa начинается с аббревиатуры http, обозначающей вид протокола передаваемых данных, в данном случае это HyperText Transmission Protocol (протокол передачи гипертекста). Далее следуют двоеточие, две косые черты и латинские буквы www, после которых ставится точка. Затем идет конкретный адрес, содержащий название учреждения, персоны или аббревиатуру и, через точку, - указание на организационную или географическую принадлежность объекта. Организационная принадлежность, указываемая преимущественно для американских серверов, обозначается тремя символами, интуитивно понятными знающим английский язык: gov - правительственные, edu - образовательные, com - коммерческие, org - неправительственные и некоммерческие учреждения, mil - военные, net - сами сети. Географическая принадлежность выражается двумя символами: .ru - Россия, .uk - Великобритания, .са - Канада, .nl - Нидерланды и т. д. Так, например, адрес web-cepeepa Библиотеки Конгресса США - http://www.loc.gov, Гарвардского университета - http://www.harvard.edu, автомобильной корпорации «Форд» - http://www.ford.com, Российской Академии наук (Russian Academy of Science) - http://www.ras.ru, футбольного клуба ЦСКА - http://www.cska-football.ru, Российской Государственной библиотеки - http://www.rsl.ru. Ряд стран, в числе которых Австралия и Япония, используют одновременно как географический, так и организационный код. Например, адрес Технологического университета в Сиднее (University of Technology, Sidney) будет иметь вид http://www.uts.edu.au, а сайт японской корпорации Sony - http://www.sony.co.jp.

3.2.3. Информационно-поисковые системы и интернет-каталоги

Информационно-поисковые системы

Эти программы периодически исследуют содержимое всех ресурсов Интернета. Они называются роботами или ботами. Ни одна поисковая машина не в состоянии проиндексировать весь Интернет.

Степень выдаваемых пользователю URL-адресов можно построить, исходя из двух принципов. Первый принцип – степень соответствия содержания ресурса тематике запроса – т.е. релевантность. Второй принцип – расположениеURL-адресов в календарном порядке, т.е. на основе учета времени их создания.

Постарайтесь не привыкать только к одной поисковой системе. С самого начала практической работы по поиску надо усвоить, что нельзя ограничивать свою работу только одной поисковой системой (напр. GoogleилиYandex.)

Метапоисковая система. Метапоиск дает возможность искать ресурс одновременно по нескольким поисковым системам. Необходимость использования метапоисковых машин связана с тем, что разные поисковики имеют различные базы данных проиндексированных ресурсов. Поэтому метапоисковая система, как правило, избавляет от возникающей необходимости последовательного поиска информации с помощью разных информационно-поисковых систем.

Nigma.ru

История проекта началась с исследований в области искусственного интеллекта, которые проходили на кафедре АСВК факультета вычислительной математики и кибернетики МГУ им М.В. Ломоносова в 2004-м году. Именно там познакомились и начали работу над Нигмой основатели проекта Виктор ЛавренкоиВладимир Чернышов. В 2005 году поисковики уже выдавали сотни тысяч ссылок на один запрос, просмотреть которые, просто, физически, было невозможно. Поэтому появилась потребность структурировать многочисленные результаты поиска. Для этого был созданкластеризующийпоисковик, который позволяет уточнить запрос пользователя, группировать и фильтровать результаты поиска по темам. Так же была разработана и внедрена уникальная система исправления ошибок, которая позволяет исправлять до 4-х грубых ошибок в одном слове (включая опечатки).

Интернет-каталоги

Каталоги - система древняя, и принципы их построения давно известны. Могут быть универсальными или проблемно-ориентированными, отраслевыми, частными.

  • Яндекс каталог http://www.yaca.yandex.ru/

  • Апорт http://www.aport.ru/илиhttp://www.see.ru/Апорт Лайт

  • List.ru– каталог с наибольшим числом разделов.

  • Улитка http://ulitka.ru/

Достаточно быстрого взгляда на эти каталоги, чтобы стало ясным - систематического охвата всех информационных областей Интернета в них нет. Главным же впечатлением будет казаться бессистемность рубрик. Они исходят из логики спроса. Здесь на первые позиции выдвигаются те разделы, которые вызывают наибольший интерес пользователей. Это контролируется учетом числа посещений. Их можно назвать частотными. Они учитывают интересы пользователя.

Рейтинги сайтов:

  • Рамблер топ 100

  • Spylog http://dir.spylog.ru/

Таким образом, существуют поисковые задачи, когда лучше работать с поисковым каталогом, и задачи, когда лучше пользоваться полнотекстовым поиском.

Язык запросов

Некоторые слова, не имеющие смыслового значения, такие как предлоги и союзы (стоп-слова), могут игнорироваться поисковиками. Нужны специальные операторы для использования стоп-слов, хотя бывают случае, при которых игнорирование союзов и предлогов меняют семантическое значение запроса.

Ответ 5. Формулировка поискового запроса.

Сначала выбираются нужные ключевые слова.

При прочих равных условиях следует выбирать для поиска наиболее суженное, мало распространенное слово. Если поиск по слишком узкому термину ни к каким результатам не приводит, то тогда следует постепенно расширять поисковое понятие или же переходить к смежным терминам. Более совершенный поиск лучше вести по нескольким словам, точнее по сочетанию слов, а иногда и по конкретным фразам. Напр.: Крымская война или Оборона Севастополя. Следование таким простым правилам намного упрощает – рафинирует поиск.

Иногда при пользовании обычной русской системой бывает необходимо учесть строгую форму слова. Тогда в запросе перед ним ставится символ, обозначающий, что для данного слова не требуется производить морфологический поиск. Этот и ему подобные знаки используются во всех поисковых системах.

!Соображаю !что !чему Слова в точной форме с заданным регистром в Яндексе

Если возникает необходимость – надо обратиться к «Помощи».

Если нет каких-либо особых соображений, запрос надо писать строчными буквами. В личных именах первые буквы лучше писать с прописной буквы. Ряд поисковых систем считает, что производится поиск по имени собственному, если несколько слов подряд (2-4) начинается с прописных букв. В таких случаях система будет отыскивать только те ресурсы, где эти слова расположены рядом.

Знаки “” или ‘’ используются для поиска конкретных словосочетаний или выражений очень близких к ним. Они удобны при поиске по фразам. Такой запрос называют контекстным.

В ряде случаев, например в Яндексе (http://help.yandex.ru/search), можно при помощи знаков + или - управлять и порядком слов.

должен /2 казнить

Расстояние в пределах двух слов в любую сторону (то есть между заданными словами может встречаться одно слово)

государственное дело && /3 улавливаешь нить

Расстояние в 3 предложения в любую сторону

при моем /+2 уму

Расстояние в пределах двух слов в прямом порядке

щи /(-1 +2) хлебаю

Расстояние от одного слова в обратном порядке до двух слов в прямом

В ряде случаев надо, чтобы при поиске учитывались самые различные окончания слов. Для этого после «значащей» части слова ставится *. Или т.н. поиск с усечением. Это характерно и для электронных каталогов библиотек, а также для библиографических и полнотекстовых баз данных.

Знак ? означает только одну пропущенную букву. Кроме того знак может использоваться не только в конце, но и в середине слова.

Описанные знаки не универсальны. Они меняются от одной поисковой системы к другой. Поэтому в случае нужды лучше всего воспользоваться разделами помощи соответствующей системы. Все нужное запоминается очень быстро.

Toolbar

Toolbarпоисковых систем - форма для поиска прямо в браузере. Для более удобной работы вы можете встроить средство поиска прямо в ваш браузер. При такой операции в браузере появляется дополнительная панель инструментов, называемая ToolBar, которая дает возможность осуществлять поиск, не загружая в браузер первую страницу поисковой машины. Из популярных поисковых систем, работающих с русскоязычными документами, ToolBar предоставляют Яндекс и Google, а такжеNigma.

Или поиск по URL:url:ptici.narod.ru/ptici/kuropatka.htm (есть и в Яндексе, и в Google).

Булева алгебра

Особенностью профессиональных баз данных большого объема является то, что для эффективной работы с ними нужно уметь пользоваться специальными операторами. Как лучше составить запрос при использовании нескольких «изолированых» ключевых слов? Используются специальные символы и слова – Булева алгебра или Булева логика - словесные обозначения и упрощенные символы (+,-)

  1. И &, +

трамвай и троллейбус

трамвай andтроллейбус

трамвай + троллейбус

В некоторых поисковых машинах в качестве такого оператора используется и пустое место.

трамвай троллейбус

  1. ИЛИ OR /

Оператор ИЛИ очень удобно использовать при поиске по техническим терминам с использованием английского языка. Как известно, многие из них звучат по-разному у англичан и американцев.

  1. НЕ NO ~ (тильда)

Оператор отрицания означает поиск ресурсов, которые не содержат термин, стоящий за знаком логического отрицания.

Соответствующие выражения-запросы часто называют уравнениями булевской алгебры. Нужно уметь влиять на последовательность выполнения операторов. Для этого надо воспользоваться круглыми скобками ().

трамвай/троллейбус+новые – трамвай или новый троллейбус

(трамвай/троллейбус)+новый новый троллейбус или новый трамвай

Уравнения алгебры логических операций очень удобны. Поэтому они получили серьезное развитие при специализированных видах поиска и профессионально ориентированных базах данных.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]