Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Документальные информационно-поисковые системы.doc
Скачиваний:
114
Добавлен:
10.05.2014
Размер:
5.47 Mб
Скачать

22. Логика поиска. Критерий смыслового соответствия. Теоретико-множественное представление.

Технология обработки информации – упорядоченная последовательность взаимосвязанных действий, выполняемых с момента восприятия информации до момента получения заданных результатов.

Информационная технология – это система методов, способов и средств для сбора, регистрации, хранения, поиска, накопления, обработки [..] информации.

Поиск информации – одна из основных функций ИТ.

Поиск – это процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве.

Особенности поиска:

  • сравниваются не сами объекты, а поисковые образы

  • сам процесс поиска является неодноактным и многоитерационным

Алгоритм поиска:

  • выборка очередного объекта из массива для выполнения сравнения с запрашиваемым

  • процесс сравнения

  • принятие решения о соответствии

  • переход к следующему объекту или завершение процесса

Выделяют два вида поиска:

  • поиск целостного объекта (выдается весь документ)

  • поиск информации по содержанию (некоторой части содержания)

Технология поиска может осуществляться по массиву двух видов:

  • с прямой организацией – документы расположены в произвольном порядке (по мере занесения)

  • с инвертированной организацией – имеется дополнительное разбиение на категории, обозначенные идентификаторами (с инвертированным справочником)

Критерий смыслового соответствия – это формула, в соответствии с которой производится логическое и лингвистическое преобразование (развертывание) ПП с тем, чтобы найти ПОД, содержащий релевантную информацию, независимо от ее лексического представления.

Теоретико-множественная модель(??)

релевантные

нерелевантные

выданные

a

b

не выданные

c

d

  • Частные критерии оценки:

  • полнота – доля выданных релевантных документов: r = a/(a+c)

  • точность – доля релевантных среди выданных: р=а/(а+b)

  • специфичность – доля невыданных и нерелевантных среди невыданных: σ = d/(b+d)

  • относительный объем выдачи: ν = (a+b)/(a+b+c+d)

  • общность – доля релевантных документов среди всего информационного массива

23. Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления.

Информационные системы - комплекс, состоящий из информ-го фонда и процедур: управляющей, обновления, информ-го поиска и завершающей обработки, - позволяющего накапливать, хранить, корректировать и выдавать информацию.

Система (целое, составленное из частей соединение) – совокупность элементов, взаимодействующих друг с другом и образующих определенную целостность.

Элемент системы – часть системы, имеющая определенное функциональное назначение. Сложные элементы систем, в свою очередь состоящие из более простых взаимосвязанных элементов, часто называют подсистемами.

Организация системы – внутренняя упорядоч-ть, соглас-ть взаимодействия элементов системы (проявляющаяся, в частности, в ограничении разнообразия состояний элементов системы)

Структура системы – состав, порядок и принципы взаимодействия элементов системы, определяющие основные свойства системы.

Архитектура системы – совокупность свойств системы, существенных для организации взаимодействия ее составляющих.

Целостность системы – принципиальная несводимость свойств системы к сумме св-в отдельных ее элементов и зависимость св-в каждого эл-та от его места и функции внутри системы. С точки зрения формы существования системы выделяют абстрактные и материальные системы.

Абстрактные системы – это системы, которые имеют в качестве операционных объектов преимущественно идеализированные, например, знания, теории, гипотезы.

Материальные системы подразделяются на технические, эргатические и эргатехнические (смешанного типа).

Информационные системы (ИС) – материальная сист, организующая, хранящая и преобраз-я информ. Это сист, основным предметом и продуктом труда в кот-й явл информация.

Управление – это процесс обработки информации, направленный на достижение определенной цели. Управление – это функция системы, обеспечивающая либо сохранение ее основных свойств, либо ее развитие в заданном направлении.

Для исследования характера взаимодействия управляемого процесса и информационной системы через определенные структуры и характера информационных потоков между ними будем рассматривать эти элементы с позиции системного подхода, т.е. «…система представляет собой отражение материального образования с точки зрения единства его поведения и строения, обусловленность поведения этого целого определяется спецификой внутреннего строения, спецификой его элементов и особенностями взаимодействия между ними. Т.е., система – это такое строение, которое осуществляет преобразование причинных воздействий из окружающей среды и изнутри системы в соответствующие изменения объекта как целого». Понятие «поведение» отражает связь изменений в окружающей среде и/или самой системе с внешними или внутренними причинными воздействиями, вызвавшими эти изменения, а «строение» системы, как противоположное свойство, определяется единством множества элементов и структуры, осуществляющей их интеграцию в целостное образование.