Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Otvety_na_ekz_bilety.docx
Скачиваний:
10
Добавлен:
26.08.2019
Размер:
274.89 Кб
Скачать

Билет 24 Рейтинги

Рейтинг (или топ) — это каталог, в котором ссылки на сайты внутри категорий сортируются по популярности сайтов.

При подсчете популярности учитываются:

    • Хиты (визиты) — общее число заходов на сайт.

    • Хосты — количество уникальных посетителей за отчетный период (день, неделю, месяц).

Если пользователь посетил новый для себя сайт 10 раз, то число хитов этого сайта увеличивается на 10, а число хостов — на 1.

Для включения в каталог рейтинга владелец сайта размещает на страницах своего сайта (на главной и, возможно, на других узловых страницах) счетчики владельца рейтинга.

Счетчик представляет собой небольшой HTML-код, содержащий скрипт (программу). Когда посетитель открывает в Интернете страницу со счетчиком, скрипт связывается с сервером рейтинга и добавляет единицу к счетчику хитов сайта, а также к счетчику его хостов, если пользователь посетил сайт впервые в течение отчетного периода.

Уникальность посетителя (хост) определяется по IP-адресу компьютера, с которого была выполнена загрузка страницы сайта со счетчиком.

Рамблер: top100.rambler.ru

Spylog: dir.spylog.ru

Mail: top.mail.ru

Directrix: directrix.ru

Билет 25 Индексы (состав и схема работы, популярные индексы)

Каталоги и рейтинги удобны для поиска сайтов по теме, но они плохо помогают, когда нужно найти конкретную информацию или фрагмент текста, содержащий определенные ключевые слова.

Кроме того, каталоги и рейтинги охватывают лишь очень небольшую часть Интернета, и даже в ней плохо отслеживают изменения, которые происходят в Интернете каждый день.

Более мощным инструментом поиска с широким охватом Сети являются индексы (поисковые системы, поисковики) — сервера, которые автоматически, при помощи специальных программ (их называют пауками) постоянно сканируют страницы Интернета и индексируют их, то есть заносят в свою огромную базу данных.

Когда пользователь выдает запрос в индекс, поиск выполняется уже не в Интернете, а в базе данных индекса, и поэтому отнимает очень мало времени.

На сервере индекса располагаются:

    • База данных по страницам Интернета: сами страницы в сжатом виде и словарь по ним (индекс).

    • Программы для сбора страниц Интернета (пауки).

    • Программа для поиска информации в базе данных.

    • Сайт, на котором пользователь может записывать запросы на поиск и просматривать результаты.

Состав и схема работы индекса.

Сетевые пауки трудятся непрерывно и автономно: они обшаривают по гипертекстовым ссылкам все закоулки Паутины и заносят информацию в базу данных, периодически проводя ревизию уже проиндексированного материала.

Популярные сайты с быстро обновляемым содержимым (новостные порталы, интернет-магазины, аукционы и т.п.) переиндексируются несколько раз в час, обычные — несколько раз в месяц или реже.

Стартовыми точками для пауков являются крупные популярные сайты. Паук начинает свой путь с такого сайта, обрабатывает его и двигается дальше по внешним ссылкам сайта.

Система поиска по базе индекса обслуживает запросы пользователей.

Многие поисковые системы предоставляют возможность авторам самостоятельно добавлять свои ресурсы в очередь на индексирование. Это существенно ускоряет обработку сайта, а в случаях, когда никакие внешние ссылки не ведут на сайт, вообще оказывается единственной возможностью заявить о его существовании.

В индексе поисковой системы с каждым словом или фразой связан список ссылок на документы, в которых это слово или фраза встречается. Кроме того, каждая ссылка снабжается весом — числовой оценкой ее значимости.

При вычислении веса ссылки, связанной со словом из индекса учитываются следующие факторы:

  1. Индекс цитирования документа (ИЦ). Более весомым считается документ, на который есть много ссылок с других сайтов, причем цитирование с крупных популярных сайтов оценивается выше.

  2. Свежесть страницы. Вес ссылки выше для более “свежих” страниц, то есть страниц с более новой датой обновления.

  3. Написание ссылки. Ссылка имеет повышенный вес, если слово входит в состав самой ссылки (например, слово microsoft входит в состав ссылки на сайт компании: www.microsoft.com).

  4. Ссылка имеет повышенный вес, если слово входит в состав названия окна, в которое выводится страница документа. В HTML-коде название окна задается тегом TITLE.

  5. Вес ссылки повышается, если слово входит в состав списка ключевых слов страницы (тег META с атрибутом keywords), или в состав описания страницы (тег META с атрибутом description), или если слово входит в состав альтернативного текста картинки (атрибут alt тега IMG).

Кроме того, при подсчете веса ссылки учитываются разные параметры появления слова (к которому относится ссылка) в тексте документа:

    • Форматирование. Больший вес имеют документы, в которых слово встречается в заголовках и разного рода выделениях (жирность, курсив, повышенный размер шрифта).

    • Место слова в документе. Больший вес имеют документы, в которых слово встречается в начале документа, а также в навигационном меню сайта или страницы.

    • Частота появления слова в документе. Документ, в котором слово встречается чаще, имеет больший вес.

Индекс ранжирует список результатов в порядке релевантности — степени соответствия полученных результатов ожидаемым.

Первыми в списке оказываются те страницы, которые имеют большую релевантность. В силу этого достаточно просмотреть первые 10–20 страниц из сотен тысяч найденных, чтобы обнаружить подходящую.

Билет 26

Простой поиск и сложный поиск

Простой поиск.

Поиск в индексе можно выполнять в следующих режимах:

  1. Простой поиск

  2. Расширенный поиск

  3. Поиск с помощью языка запросов

Простой поиск – поиск, при котором в запросе (ключевой фразе поиска) не используются элементы языка запросов, задаваемые явно или при помощи интерфейсных элементов на странице расширенный поиск поисковой системы.

Расширенный поиск

Расширенный, или сложный, поиск — это поиск ключевой фразы при дополнительных условиях, задаваемых интерфейсными элементами (флажки, кнопки, меню, поля ввода) на странице расширенный поиск поисковой системы.

Например, в Яндексе из режима простого поиска в расширенный ведет соответствующая ссылка рядом со строкой ввода запроса.

На странице расширенного поиска строка ввода дополняется формой с набором разного рода интерфейсных элементов (флажки, радиокнопки, меню, поля ввода), позволяющие задать условия поиска.

Рассмотрим форму для ввода условий на примере Яндекса.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]