Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы_ГОС_магистр.doc
Скачиваний:
74
Добавлен:
09.09.2019
Размер:
4.03 Mб
Скачать
  1. Технологии извлечения знаний из больших баз данных. Типология поисковых задач.

Поисковые задачи и виды информационного поиска

  1. Типология поисковых задач

  2. Типология информационной неопределенности

  3. Формы выражения запроса

В задачах информационного поиска качественно различают 2 составляющие:

  • концептуальную;

  • технологическую.

К концептуальной составляющей относят методы и средства представления собственно информации, которая используется в качестве основы для проектирования механизма поиска и для организации процессов взаимодействия пользователя с АИПС (информационно-поисковая).

К технологической составляющей относят средства пользовательского интерфейса, алгоритмы индексирования и поиска, языки запросов, средства интеграции информации из различных источников.

Особенностью поискового процесса, рассматриваемого как взаимодействие 2х систем представления знаний «пользователь-АИПС» является: многоуровневость и неоднородность объектов в цепи информационных преобразований. Операционными объектами, участвующими во взаимодействии является: поисковый образ документа (ПОД), поисковый образ запроса (ПОЗ).

Для установления соответствия содержания на смысловом уровне, пользователь должен реконструировать содержание по перечислению основных понятий и, далее полученный образ он соотносит с реальной потребностью.

Возникает вопрос адекватности образа действительному содержанию документа. Эта адекватность определяется качеством процесса свертки информации и уровнем знания субъектом средств отражения, а именно: концептуальной схемы предметной области, возможностей информационно-поискового языка.

По характеру и степени соотношения в предмете поиска известного и неизвестного, т.е. степени семантической неопределенности можно выделить 3 типа поисковых задач: предметный (атрибутивный) поиск:

  • Задачи поиска объекта, когда известно, что этот объект существует

Поисковая модель (логическая идентификация) объекта поиска представляется как поиск по атрибутам или отбор по логическому выражению над именами понятий, задаваемыми терминами или их комбинациями

  • Тематический поиск: подбор информации по некоторой теме

Тематический поиск-нахождение в среде информационной системы описаний существующих в предметной области объектов, свойства которых могут быть полностью определены на уже известном множестве атрибутов.

Неопределенность отображения объекта на предметную область порождается возможной множественностью системного основания на уровне среды ИС.

Поисковая модель в этом случае – поиск по части известного понятия или связям, частично задаваемым комбинацией характеристических признаков.

Часто тематический поиск реализуется как последовательность атрибутивных поисков, каждый из которых соответствует определенному априорно заданному системному основанию представления объекта поиска.

  • «Проблемный поиск»: по сути является основной составляющей творческого процесса определения путей решения профессиональных задач пользователя.

«Проблемный поиск»-нахождение в информационной среде описания объектов или их составляющих, потенциально существующих в предметной области и, в совокупности, возможно, образующих целое, т.е. этим свойствам в явной форме не соответствуют собственные атрибуты, а новое свойство может быть задано комбинацией уже существующих. В этом случае к неопределенности отображения объекта на предметную область (см. тематический поиск) добавляется неопределенность на уровне субъект-объект, что означает, что представление, которое субъект имеет об объекте, может не соответствовать действительности.

Логическая поисковая модель в этом случае - это поиск похожих документов, содержание которых некоторым образом ассоциируется с задачей пользователя.

Типология поисковых задач с тз структурной полноты объекта поиска проявляется следующим образом: в виде композиции

, где Si-объект поиска, Mi-множество документов, Ai-набор системообразующих признаков,Ri- множество системообразующих отношений, Zi-системообразующий закон композиции.

В таком случае предметный поиск определяется как нахождение Si по его системному основанию:

Тематич поиск-нахождение подмножества систем (объектов), причем, считается заданным Zi и одно из Ai/Ri.

Проблемный поиск: