- •1.Определения понятия «информации». Прагматические и атрибутивные свойства информации.
- •2. Свойства концентрации и рассеяния информации. Характер закономерностей.
- •3. Понятия «информационный объект», «информационное взаимодействие».
- •4. Определение понятия информации с точки зрения информационного взаимодействия.
- •6. Модель процесса генерации знания в рамках общей теории систем.
- •7.Соотношение понятий «данные», «информация», «знания».
- •8. Модель процесса информирования. Типовые схемы информирования.
- •9. Потребители, приемники информации, информационная потребность. Понятие формальной и истинной релевантности документа.
- •10. Определение ис. Организационно-функциональная структура аис
- •11. Назначение и классификация информационных систем. Конкретная и абстрактная ипс. Отличия документальных и фактографических ипс.
- •12. Структурная схема процессов в абстрактной аипс. Режимы ретроспективного поиска и ири.
- •13. Состав, назначение, требования к ипя. Классификация дескрипторных ипя.
- •14. Парадигматические и синтагматические отношения между лексическими единицами ипя. Меры близости лексических единиц.
- •15. Предкоординированные и посткоординированные информационно-поисковые языки.
- •16. Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ис.
- •17. Обобщенная схема воспроизводства информации. Характеристика информационных компонент.
- •18. Типология информационных потребностей (когнитивная модель)
- •19.Типология неопределенностей информационного поиска. Уровневая модель представления информации и информационных потребностей.
- •20. Типология задач информационного поиска. Характер неопределенности объекта поиска и требования к поисковому процессу для разных типов поисковых задач.
- •21. Понятие стратегии и технологии поиска. Связь стратегии и типа поисковой задачи.
- •22. Логика поиска. Критерий смыслового соответствия. Теоретико-множественное представление.
- •23. Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления.
- •24. Уровневая модель информационного взаимодействия "Пользователь - аипс". Основные этапы (общая схема) поиска информации.
- •25. Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.
- •26. Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.
- •27. Назначение и организация инвертированной формы представления документальной информации. Примерная организация поисковых массивов документальной ипс дескрипторного типа.
- •28. Типы обратной связи в технологии информационного поиска.
- •29. Линейная модель механизма поиска по совпадению терминов.
- •30. Линейная модель механизма поиска по логическому выражению.
- •31. Линейная модель механизма поиска документов-аналогов.
- •42. Коэффициент линейной корреляции множества выданных и истинно релевантных документов.
- •43. Назначение, состав и структура лингвистического обеспечения ис.
- •44. Основные методы идентификации объектов.
- •45. Классификация. Определение и формально–логические правила построения.
- •46. Типы классификаций. Иерархические классификации. Примеры.
- •47. Типы классификаций. Фасетные классификации. Примеры.
- •48. Сравнительная характеристика иерархических и фасетных классификаций.
- •49. Кодирование объектов. Системы кодирования. Примеры.
- •50. Назначение, структура и использование информационно-поисковых тезаурусов.
- •51. Обобщенная технологическая схема и компоненты информационного поиска.
- •52. Типовые реализации интерфейсов подготовки поисковых выражений, их особенности.
42. Коэффициент линейной корреляции множества выданных и истинно релевантных документов.
Коэффициент линейной корреляции R выдачи и релевантности документов представляет собой корреляционный момент двух случайных величин:
С – «быть выданным документом» (формально релевантным с точки зрения системы);
И – «быть релевантным» (истинно релевантным с точки зрения пользователя).
Каждая из велечин может иметь значения 0 и 1 в зависимости от конкретного документа.
Математические ожидания С и И:
-
M [C] = P(C=1) =
a + b
; M[И] =
a + c
a + b+ с+ d
a + b + с +d
Дисперсии определяются:
σ²с = |
(a + b) · (с +d) |
;σ²и = |
(a + c) · (b + d) |
;covси=M[CxИ] –M[C]xM[И]= |
ad – bc |
( a + b+ с +d) ² |
( a + b+ с +d) ² |
( a + b+ с +d) ² |
Окончательно:
R = |
COVси |
= |
ad - bc |
√σ²с σ²и |
√ (a + b)(a + c)(b + d)(c + d) |
В различных точках координат <n,x> значения (знаки) R следующие:
R(0) = 0, R(p0) = 0, R(И) = +1, R(Д) = -1, R(1) > 0, R(2) > 0, R(3) < 0
R = 0 повсюду на линии 0 – p0
Для этого достаточно показать, что:ad–bc=n0(x-n p0)
На линии 0p0 справедливо:x=n·(X0/ n0) =np0 =>ad–bc= 0
Обозначая : |L∩L© | =L, |Lи| = Lи, |Lc| =Lc, |L0| =L0
Перепишем R в координатах <L>:
R = |
LL0 – LиLc |
√LиLc(L0 –Lи)(L0 – Lc) |
43. Назначение, состав и структура лингвистического обеспечения ис.
Лингвистическое обеспечение – это совокупность языковых средств, обеспечивающих гибкость представления и обработки информации с помощью АИС(автоматизированная поисковая система). Обычно ЛО включает языки запросов и отчетов, реализующие человеко-машинное взаимодействие, а также специальные языки определения и управления данными, обеспечивающие адекватность внутреннего представления и согласование внутреннего и внешнего представлений.
Лингвистическое обеспечение ИС – это совокупность языковых средств, позволяющих представить информационную составляющую ИС на различных этапах внутрисистемной обработки и взаимодействия с пользователем.
Такое определение предполагает выделение 2-х взаимообусловливающих аспектов использования ЛО: выражения смыслового содержания ИР и выражения информационной потребности пользователя.
Состав лингвистического обеспечения информационных систем может быть представлен следующей схемой
Лингвистическое
обеспечение ИС Языки
описания данных Языки
манипулирования данными ИПЯ,
языки
запросов Терминологические
структуры Линейные Иерархические Сетевые
Такая схема представляет собой иллюстрацию, отображающую эволюцию и особенности применения языковых средств в ИС; ИПЯ – как средства выражения смыслового содержания документов и информационной потребности пользователя. SQL- как средства управления данными. Терминологических структур – как моделей данных, с одной стороны, и понятийных систем, выражаемых средствами искусственного языка с естественной лексикой с другой.