Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ExQ_s_giperssylkoy.doc
Скачиваний:
99
Добавлен:
26.03.2016
Размер:
815.1 Кб
Скачать

1.2. Основные информационно-поисковые режимы

Режим избирательного распределения информации(ИРИ) представляет собой такую форму информационного обслуживания, при которой из непрерывно обновляемого потока информации производится отбор документов, соответствующий заранее составленным запросам, которые остаются неизменными в течение некоторого фиксированного промежутка времени

При ретроспективном поиске(РЕТРО) из постоянного (или условно-постоянного) массива документов составляется набор, соответствующий разовому запросу

1.3. Основные типы ипс

Выделяют следующие основные типы ИПС:

  • документальные ИПС;

  • фактографические ИПС (информационно-справочные системы – ИСС);

  • информационно-логические системы.

Документальная ИПСпредназначена для выдачи документов либо адреса их хранения по данному запросу. В памяти такой системы хранятся либо сами документы, либо их рефераты, либо их ПОД для отсылок (ПОД-поисковый образ документа)

Фактографическая ИПСвыдает хранящиеся в памяти факты в соответствии с запросами пользователей. Память фактографической ИПС хранит поисковые образы соответствующих фактических сведений и их номера либо сами фактические сведения.

Для фактографической ИПС не стоит вопрос о степени полноты обработки запроса, запрос может быть либо выполнен, т. е. факт найден, либо не выполнен. Для документальной ИПС запрос может быть сформулирован так, чтобы поиск производился, например, по рефератам. Полнота такого поиска может быть оценена количественно.

Информационно-логическая системахранит как набор данных, так и алгоритмическое и программное обеспечение, позволяющее в ответ на запросы пользователя осуществлять не только поисковые процедуры, но и анализировать имеющиеся сведения, синтезировать новые, не содержащиеся в памяти системы в явной форме

Информационно-логические системы могут применяться при составлении аналитических обзоров, прогнозировании, в научных и проектных работах, требующих делать выводы на основании анализа большого количества фактов. В этом проявляется их сходство с системами поддержки принятия решений.

  1. Основные характеристики ипс. Первичные и вторичные параметры оценки ипс.

1) Функциональные возможности ИПС, т. е. количество доступных системе функций или режимов работы.

2) Производительность ИПСхарактеризуется:

  • объемом информационного фонда;

  • максимальной интенсивностью обслуживаемых запросов;

  • максимальной интенсивностью поступления информации.

3) Время обращенияинтервал между получением запроса и выдачей затребованных данных.

4) Релевантность –способность выданных документов удовлетворять запрос пользователя по основному смысловому содержанию. Эквивалентна поисковой функции.

5) Пертинентность –свойство соответствия выданных документов информационной потребности пользователя. Если из десяти документов, выданных ИПС, восемь соответствовали запросу, но только пять были затребованы потребителем (например, в виде копий), то говорят, что в выдаче было восемь релевантных, из них пять пертинентных документов.

Первичные параметры, применяемые для оценки ИПС, представляются в виде таблицы сопряженности

Вторичные параметрыустанавливаются при помощи таблицы сопряженности:

Таблица сопряженности первичных параметров оценки ИПС

Массив документов

Релевантных

Нерелевантных

Всего

Выданных при поиске

Р

В-Р

В

Не выданных при поиске

П-Р

М-П-В+Р

М-В

Весь информационный фонд

П

М-П

М

М – массив документов;

П – общее количество релевантных документов в массиве;

Р – число выданных релевантных документов;

В – всего документов в выдаче.

Вторичные параметры

1. Коэффициент полноты или чувствительность(показатель способности ИПС выдавать потребителю релевантные документы)отношение числа выданных релевантных документов к их общему числу в информационном фонде

.

2. Коэффициент точности —отношение числа релевантных документов в выдаче к общему числу документов, полученных в результате поиска

.

3. Коэффициент осадка —отношение количества выданных нерелевантных документов к количеству нерелевантных документов в информационном фонде

.

4. Коэффициент общности —отношение общего количества релевантных документов в информационном фонде к количеству документов в информационном фонде

.

5. Коэффициент шума —отношение числа нерелевантных документов в выдаче к ее размерам

.

6. Условная вероятность промаха —отношение невыданных релевантных документов к общему количеству релевантных документов в информационном фонде

.

7. Специфичность(показатель способности ИПС не выдавать потребителю- нерелевантных документов) – отношение невыданных нерелевантных документов к их общему числу в информационном фонде

.

8. Доля релевантных документовв общем числе невыданных документов — отношение невыданных релевантных документов к общему числу невыданных документов

.

Между полнотой Ки точностьюТсуществует обратная зависимость: увеличение точности информационного поиска на 1 % уменьшает его полноту приблизительно на 3 % [9].

  1. Это наиболее используемые параметры.

  2. Коэффициент общности дает качественную оценку содержимого информационного фонда по отношению к конкретному запросу.

Остальные параметры оценивают склонность поисковых алгоритмов к ошибкам первого и второго рода.Аналогичные критерии можно было бы сформулировать для пертинентности, что дало бы оценку качества реализации языковых средств.

  1. Схема функционирования ИПС. Понятие критерия смыслового соответствия.

Унифицированная схема функционирования ИПС в режимах обработки запроса и ввода документа в информационный фонд системы приведена на рис

Критерий смыслового соответствия - формальное правило, по которому поисковые образы документа и запроса считаются совпадающими или несовпадающими.

Средства реализации критерия смыслового соответствия в ИПС называются логикой поисковой системы,включающей в себя два основных элемента – базисные отношения и правила сравнения.

Базисными отношенияминазывается смысловая связь, существующая между кодируемыми понятиями вне ИПС. Сюда входят обычные отношения между понятиями, в первую очередь отношения структуризации.

Правила сравненияесть правила или алгоритм процедуры сопоставления ПОЗ и ПОД.

ИПЯ- информационно-поисковый язык

ПОЗ- поисковый образ запроса

ПОД- поисковый образ документа

ЕЯ-естественный язык

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]