Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информационные системы.doc
Скачиваний:
23
Добавлен:
01.06.2015
Размер:
236.54 Кб
Скачать

Пертинентность

Для пользователя пертинетность, соотношение объема полезной для него информации к общему объему полученной информации, имеет решающее значение. При этом следует учитывать, что формальный запрос к системе является предметом творческого осмысления информационной потребности и не всегда точно отражает последнюю. Неумение большинством пользователей правильно формулировать запросы и получать приемлемые объемы отклика породило в конце 20 века мнение об Интернет, как об огромной информационной свалке. Достижение высокой пертинентности - основное поле конкурентной борьбы современных поисковых систем. Именно для максимального удовлетворения информационных потребностей пользователей информационно-поисковые системы сегодня максимально интеллектуализируются - получили широкое практическое применение теории и методы семантических сетей, контент-анализа и глубинного анализа текстов (Text Mining).

Что такое релевантность

Дата публикации: 10.05.2012

Релевантность(от лат. relevo — облегчать, поднимать) в информационном поиске означает соответствие образа документа поисковому запросу. Проще говоря - это то, насколько результат поиска полезен пользователю поисковой системы.

"Релевантная выдача" означает поисковую выдачу с качественными материалами по запрошенной теме. Нерелевантной является выдача, предоставляющая данные не соответствующие ожиданиям запроса.

Как определяется релевантность.

В упрощенном виде релевантность определяется процентом вхождения ключевого запроса к общему объему текста. Релевантным считается текст, с плотностью ключевых фраз примерно 4-7%. Их большее наличие может быть принято поисковыми системами за поисковый спам и как результат - наложение ограничивающих санкций в виде фильтров.

Естественно, алгоритм определения релевантности сложней и кроме соответствия текста учитывает:

  • наличие ключей в заголовках документа;

  • релевантность ссылок на страницу с других ресурсов;

  • репутация этих ресурсов;

  • "вес" страницы;

  • и другие нюансы.

Однако, эти алгоритмы построены на одинаковых принципах и их соблюдение приведет к высоким позициям в серпе.

Пертинентность

Дата публикации: 11.05.2012

Пертинентность( в переводе с лат. pertineo — отношусь, касаюсь) — это соответствие найденных поисковой системой материалов информационным потребностям пользователей, вне зависимости от точности текста этого запроса.

Проще говоря, это соотношение полезного объёма выдачи информации к общему и удовлетворенность пользователя этими результатами.

Продемонстрировать пертинентностьможно на примере запроса: "новый фильм". В результате могут оказаться фильмы, который были новыми несколько лет назад , а то и вообще обсуждения и анонсы.

Именно на улучшение пертинентностив настоящее время направлены усилия поисковых систем, чтобы в идеале каждому пользователю выдавались именно для него отобранные результаты. И чтобы организовать максимально релевантную выдачу, учитывается "новизна информации" и все больше изучаются интересы людей и их поведение, которые фиксируются в «поведенческом факторе».

Запросы пользователей

Казалось бы, с развитием технологических возможностей, современные поисковые системы должны обеспечить гарантированное нахождение информации, однако "ленивые" пользователи все же, очень часто не довольны качеством их работы. Основная масса пользователей не хочет прикладывать особых интеллектуальных усилий при формировании критериев поиска. Удивительно низким оказывается процент использования запросов, усложненных хотя бы одним логическим или контекстным оператором. Около 80 % запросов состоят из одного или двух слов. Если и используются операторы, то это в основном булевы AND и OR. Доля использования операторов контекстной близости и логического отрицания (NOT) не превышает 1-2%. В то же время, реализация отработки сложных запросов (которых пока не более 20%) и определяет эффективность использования времени, проводимого пользователем в Интернет.

Для ввода сложных запросов требуется использование булевых и контекстных операторов, скобок, указание полей и т.п., что недоступно для среднестатистического пользователя. Поисковые службы обычно создают два интерфейса - простой (по умолчанию) и расширенный (называемый в разных системах детальным, мощным или профессиональным), однако главная задача коммерческих поисковых служб как раз и заключается в удовлетворении информационных потребностей среднестатистического пользователя.

Назовем лишь некоторые возможности языков запросов наиболее популярных систем - возможности которые есть в распоряжении пользователей, но которые используются в очень небольшой части. Во всех современных системах реализованы булевы операторы AND, OR и NOT, а также работа со скобками. Однако в двух из них - AltaVista и Excite оператор NOT записывается в виде "AND NOT", - таким образом подчеркивается его бинарность (в математической логике оператор NOT в чистом виде - унарный). В режимах простого поиска булевы операторы реализуются не всегда указанием их в явном виде. Например, во многих поисковх системах пробел между словами запроса по умолчанию воспринимается как оператор AND (Allthenews, Google, META и UAport). В то же время при указании опций типа "any of the words", пробел в таких системах воспринимается как OR. Кроме тог, в Alltheweb допускается использование операторов "+" и "-" перед словами фактически как синонимов операторов AND и NOT, соответственно. Точно так же используются эти операторы в AltaVista, Excite, Lycos и Апорт. Большинство профессиональных поисковых систем обеспечивает выполнение операций контекстной близости, одна из реализаций которой - поиск выражений в кавычках. В системе Яndex режим контекстного поиска называется "поиском с расстоянием". В общем виде ограничение по расстоянию задается выражением вида "/(n m)", где n - минимальное, а m - максимальное допустимое расстояние. В системе Апорт существует два вида ограничения по расстоянию: в словах "wN(...)", где N - число слов и в предложениях "sN(...)", где N - число предложений.

Можно отметить, что у самой популярной сегодня системы Google - самый лаконичный набор операторов - "+", OR и "-" и реализована возможность поиска по фразам в кавычках.