- •1.Определения понятия «информации». Прагматические и атрибутивные свойства информации.
- •2. Свойства концентрации и рассеяния информации. Характер закономерностей.
- •3. Понятия «информационный объект», «информационное взаимодействие».
- •4. Определение понятия информации с точки зрения информационного взаимодействия.
- •6. Модель процесса генерации знания в рамках общей теории систем.
- •7.Соотношение понятий «данные», «информация», «знания».
- •8. Модель процесса информирования. Типовые схемы информирования.
- •9. Потребители, приемники информации, информационная потребность. Понятие формальной и истинной релевантности документа.
- •10. Определение ис. Организационно-функциональная структура аис
- •11. Назначение и классификация информационных систем. Конкретная и абстрактная ипс. Отличия документальных и фактографических ипс.
- •12. Структурная схема процессов в абстрактной аипс. Режимы ретроспективного поиска и ири.
- •13. Состав, назначение, требования к ипя. Классификация дескрипторных ипя.
- •14. Парадигматические и синтагматические отношения между лексическими единицами ипя. Меры близости лексических единиц.
- •15. Предкоординированные и посткоординированные информационно-поисковые языки.
- •16. Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ис.
- •17. Обобщенная схема воспроизводства информации. Характеристика информационных компонент.
- •18. Типология информационных потребностей (когнитивная модель)
- •19.Типология неопределенностей информационного поиска. Уровневая модель представления информации и информационных потребностей.
- •20. Типология задач информационного поиска. Характер неопределенности объекта поиска и требования к поисковому процессу для разных типов поисковых задач.
- •21. Понятие стратегии и технологии поиска. Связь стратегии и типа поисковой задачи.
- •22. Логика поиска. Критерий смыслового соответствия. Теоретико-множественное представление.
- •23. Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления.
- •24. Уровневая модель информационного взаимодействия "Пользователь - аипс". Основные этапы (общая схема) поиска информации.
- •25. Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.
- •26. Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.
- •27. Назначение и организация инвертированной формы представления документальной информации. Примерная организация поисковых массивов документальной ипс дескрипторного типа.
- •28. Типы обратной связи в технологии информационного поиска.
- •29. Линейная модель механизма поиска по совпадению терминов.
- •30. Линейная модель механизма поиска по логическому выражению.
- •31. Линейная модель механизма поиска документов-аналогов.
- •42. Коэффициент линейной корреляции множества выданных и истинно релевантных документов.
- •43. Назначение, состав и структура лингвистического обеспечения ис.
- •44. Основные методы идентификации объектов.
- •45. Классификация. Определение и формально–логические правила построения.
- •46. Типы классификаций. Иерархические классификации. Примеры.
- •47. Типы классификаций. Фасетные классификации. Примеры.
- •48. Сравнительная характеристика иерархических и фасетных классификаций.
- •49. Кодирование объектов. Системы кодирования. Примеры.
- •50. Назначение, структура и использование информационно-поисковых тезаурусов.
- •51. Обобщенная технологическая схема и компоненты информационного поиска.
- •52. Типовые реализации интерфейсов подготовки поисковых выражений, их особенности.
14. Парадигматические и синтагматические отношения между лексическими единицами ипя. Меры близости лексических единиц.
Парадигматические отношения (или аналитические, базисные отношения) — логические отношения, существующие между лексическими единицами языка независимо от контекста их конкретного употребления. Можно сказать, что парадигматические отношения предопределяют отбор слов для какого-либо сообщения, но сами могут оставаться за его пределами.
Синтагматические отношения (или текстуальные, синтетические, синтаксические отношения) — это связи между лексическими единицами языка, выражающие действительные логические связи между соответствующими понятиями в тексте сообщения, которые, в свою очередь, отражают конкретные ситуативные отношения между обозначаемыми ими объектами, описываемыми в сообщении.
15. Предкоординированные и посткоординированные информационно-поисковые языки.
ИПЯ, в которых словосочетания и фразы, выражающие сложные понятия заданы в словаре наряду со словами, выражающими простые понятия. в таких словосочетаниях или фразах образующие их слова были связаны координатной или какой-либо иной связью до процесса индексирования. ИПЯ такого типа называются предкоординированными (pre-coordinate). К предкоординированным языкам относятся, например, как перечислительные, так и анали-тико-синтетические классификации. для обозначения основного смыслового содержания документов можно использовать только отдельные слова, словосочетания и фразы, взятые из словарного состава данного языка. т. е., по существу, проводится классификация документов — их отнесение к классам, обозначенным лексическими единицами этого языка. Семантическая сила предкоординированного языка определяется главным образом тем, насколько тщательно и исчерпывающе разработана его лексика. При составлении словаря для такого языка необходимо предвидеть изменения информационных потребностей в будущем. предкоординированным языкам органически присуща недостаточность словарного состава, а следовательно, и небольшая семантическая сила.
ИПЯ в которых лексические единицы (термины, слова) объединяются в «предложения» (поисковые образы) лишь во время индексирования документов ил даже в процессе их поиска называются посткоординируемыми. До индексирования лексические единицы посткоординируемых языков не связаны никакими синтагматическими отношениями. Очевидно, что такие языки будут семантически более сильными, чем предкоординируемые.
типология ИПЯ с точки зрения их семантической силы.
16. Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ис.
Системы кодирования информации Запись идентификации объекта проводится с помощью условных обозначений в виде знака или группы знаков по определенным правилам. Условное обозначение объекта при этом называется кодом, а совокупность методов и правил условного обозначения — системой кодирования.
кодирование — это процесс присвоения условных обозначений (кодов) объектам и классификационным группам в соответствии с определенной системой кодирования. Код в системе кодирования задается тройкой: с=(А, L, S), где А — алфавит (множество символов, используемых при записи кода), L — длина (число позиций в коде);
S — структура кода (порядок расположения в коде символов, используемых для обозначения классификационного атрибута). Различают следующие типы алфавитов: цифровой, буквенный и смешанный. Структура кода представляет собой, как правило, графическое изображение последовательности расположения символов алфавита.
Системы кодирования, поддерживающие методы логического упорядочения объектов с дальнейшим присваиванием отдельному объекту некоторого кода, определяющего место объекта в принятом логическом порядке, называют регистрационными. I
При использовании классификационных схем для идентификации группы объектов кодирование отдельного объекта состоит в присвоении объекту кода определенного класса классификации, системы кодирования могут быть названы классификационными.
С точки зрения длины кода: системы кодирования кодами фиксированной длины и системы кодирования кодами переменной длины. В кодах фиксированной длины каждый разряд идентифицирует конкретный атрибут классификационной схемы. Коды переменной длины ориентированы на идентификацию значений только тех характеристических атрибутов, которые определяют классификационную группу.
Классификационное кодирование применяется при кодировании объектов на основании предварительной их классификации (правила кодирования в системе кодирования определяются классификационной схемой). Различают последовательное и параллельное классификационное кодирование.
Последовательное используется для иерархической классификационной структуры: сначала записывается код класса 1-го уровня, затем код класса 2-го уровня, затем код класса 3-го уровня и т. д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о значении определенного характеристического атрибута объекта. Объекты с одинаковыми кодами составляют класс иерархической классификации.
Параллельное кодирование используется для фасетной системы классификации: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации. основано на предварительной фасетной классификации.
Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую системы.
Порядковая предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Каждый из объектов классифицируемого множества кодируется путем присвоения ему текущего порядкового номера.
Серийно-порядковая предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия при этом также будет иметь порядковую нумерацию. удобна, когда количество групп невелико. кодами служат числа натурального ряда с закреплением отдельных серий этих чисел за объектами классификации с одинаковыми признаками.
Координатное индексирование базируется на положении, что смысловое содержание документа и информационной потребности может быть с достаточной степенью точности и полноты выражено соответствующим списком так называемых ключевых слов, которые явно или в скрытом виде содержатся в тексте. Под ключевыми словами понимаются наиболее существенные для этой цели слова и словосочетания, обладающие назывной функцией. Кроме назывных в качестве ключевых слов могут выступать также соответствующие численные характеристики, хронологические данные, диапазоны температур, давлений и т. д. координатное индексирование — это способ выражения основного смыслового содержания документа или информационной потребности в виде определенной совокупности ключевых слов.
При «чистом» координатном индексировании ключевые слова в поисковых образах никак не связаны одно с другим и функционируют самостоятельно. Для отыскания документов необходимо выполнить определенные логические операции над классами, которые обозначены ключевыми словами поисковых образов документов. В простейшем случае, когда поисковое предписание сформулировано в виде логического произведения (конъюнкции) некоторого множества ключевых слов, документ считается отвечающим на информационный запрос и подлежит выдаче, если в поисковом образе этого документа одновременно содержатся все ключевые слова поискового предписания.