Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Работы / Мировые ИР_Материалы для самостоятельной работы студентов.docx
Скачиваний:
78
Добавлен:
12.06.2015
Размер:
1.35 Mб
Скачать

2. Методики составления поисковых предписаний для отечественных и зарубежных поисковых систем

В настоящее время количество поисковых систем в сети Интернет исчисляется десятками. Это и глобальные поисковые системы, индексирующие документы вне зависимости от их географической принадлежности и языка, и региональные, производящие фильтрацию документов по доменам верхнего уровня. Кроме того, поисковые системы обладают массой характеристик, связанных со скоростью обновления базы, принципами индексирования документов и возможностями составления запроса. Поэтому существует необходимость выбора оптимального поискового средства для нахождения нужной информации.

Практика показывает, что поисковые системы глобального масштаба, созданные в США, например, AltaVista (www.altavasta.com), ориентируются преимущественно на североамериканские ресурсы и англоязычные web-страницы. Документы на европейских и других языках мира представлены здесь в меньшей степени. Одна из крупнейших поисковых систем FastSearch (www.alltheweb.com), созданная норвежской компанией, тяготеет, наоборот, к европейскому Интернет-пространству. Несмотря на то, что многие глобальные «поисковики» успешно находят документы на кириллице, их возможности не могут сравниться с возможностями крупнейших российских поисковых систем, которые индексируют русскоязычную область Интернет.

Этапы проведения информационного поиска в Сети могут быть представлены следующим образом:

    • Определение географических регионов поиска.

    • Составление тезауруса (списка ключевых слов, организованного с учетом семантических отношений между ними). При составлении тезауруса необходимо предусмотреть обработку синонимов, омонимов и морфологических вариаций ключевых слов.

    • Отбор поисковых машин. Устанавливается последовательность использования поисковых машин в соответствии с убыванием ожидаемой эффективности поиска с применением каждой машины.

    • Составление и выполнение запросов к поисковым машинам. Это наиболее сложный и трудоемкий этап, связанный с обработкой большого количества информации (в основном шумовой).

Особенности составления поисковых запросов в популярных информационно-поисковых системах.

  1. Яндекс (http://www.yandex.ru) располагает самой мощной и сложной системой составления запросов, которая позволяет сформулировать поисковую задачу максимально точно. Более чем какие-либо другие системы, «Yandex» приспособлен к запросам на русском языке. Поисковый механизм сам производит расширения (падежи, числа, склонения), анализирует расстояние терминов друг от друга и пр. В списке результатов ссылки снабжаются сведениями о том, есть ли в документе совпадение фразы или же просто присутствуют все введенные термины.

Допустимо задать употребление термина только в определенном падеже, указать, на каком расстоянии от другого слова или словосочетания он должен находиться в тексте и какие термины этот текст содержать не должен. Это, однако, требует освоения весьма сложного синтаксиса формирования поисковых предписаний.

Яндекс обладает также «Расширенным поиском», представляющим собой детальную систему меню, с помощью которой можно составить сложный запрос без знания специального синтаксиса. Возможно, в частности, обеспечить сочетание нескольких фраз, исключить документы, содержащие указанные слова, конкретизировать местоположение термина в документе (заголовок, аннотация, ссылка...), применить ограничение по дате публикации, нахождению его на конкретном сайте, языку публикации. Также обеспечивается выявление иллюстраций указанной тематики. Среди сервисных функций «Yandex» есть возможность искать страницы, схожие по содержанию с конкретным документом.