- •Оглавление
- •Введение
- •Распределение часов курса по темам и видам работы
- • Литература
- •Конспект лекций
- •Вопрос 3. Классификация ис. Фактографические и документальные ис. Все многообразие ис классифицируется по присущим им признакам:
- •Лекция 3 Информационно-поисковые языки
- •Вопрос 2. Упорядочение лексических единиц ипя. Для упорядочения лексических единиц ипя служат парадигматические отношения, которые фактически определяют и задают структуру языка.
- •Вопрос 3. Требования к ипя. При разработке конкретного ипя учитываются:
- •Классификация информационно-поисковых языков
- •Вопрос 3. Методика построения и грамматика ипя дескрипторного типа. Разработка ипт осуществляется на основе следующих этапов:
- •Распределенные информационные системы
- •Вопрос 2. Система World Wide Web.
- •Экспертные системы
- •Вопрос 3. Виды эс. Экспертные системы создаются для решения разного рода проблем, но основные типы их деятельности можно сгруппировать в следующие категории:
- •Тематический поиск информации в сети интернет
- •Разработка структуры и создание базы данных "кадры"
- •Тестовые задания по курсу
- • Вопросы к зачету
Вопрос 3. Методика построения и грамматика ипя дескрипторного типа. Разработка ипт осуществляется на основе следующих этапов:
Определение тематического профиля ИПТ. Тематический профиль определяется путем анализа информационных потребностей специалистов отрасли.
Сбор лексики и формирование словника ключевых слов. Словник — исходный массив терминов, который потом подвергается семантической обработке в процессе дескрипторизации. Массив формируется путем извлечения первичных, а чаще вторичных документов и ключевых слов. Иногда используются справочная литература, опрос специалистов. Основная проблема на этом этапе формулировка ключевых слов. Служебные слова (предлоги, союзы, частицы) следует считать неключевыми; общие термины (метод, способ и т.п.) необходимо употреблять только в сочетании с другими словами, конкретизирующими их значение. Ключевыми словами могут быть словосочетания.
Построение словарных статей и формирование лексико-семантического указателя. Осуществляется дескрипторизация ключевых слов (для составления дескрипторного словаря) и установление прадигматических отношений между дескрипторами (для увеличения семантической силы языка). Устраняется неоднозначность ключевых слов путем снабжения соответствующими пояснениями — реляторами (ЗАПИСЬ – процесс, ЗАПИСЬ – предмет) Все слова группируются в классы эквивалентности: Безусловноэквивалентные (ОПУБЛИКОВАННЫЕ ДОКУМЕНТЫ = ПЕЧАТНАЯ ПРОДУКЦИЯ) и условно-эквивалентные (ТЕХНИЧЕСКИЕ СРЕДСТВА=АППАРАТУРА)
После этого производится выбор одного из слов в качестве дескриптора. Таким образом, дескриптор — лексическая единица ИПТ, под которой принято понимать нормализованное слово или словосочетание, выбранное из множества условно-эквивалентных ключевых слов для его обозначения. Свойства дескриптора:
Полнота выражения смыслового значения данного класса.
Краткость и понятность.
Частота встречаемости термина в текстах документов и запросов.
Аскриптор — лексическая единица ИПТ, входящая в класс эквивалентности данного дескриптора, которая при индексировании документов и запросов подлежит замене на дескриптор. Результат дескрипторизации: дескрипторный словарь – алфавитный перечень дескрипторов и аскрипторов. Например:
АРХИВЫ
Архивные службы
Архивные учреждения
Архивные центры
Статьи аскрипторов снабжаются отсылками на заменяющие их дескрипторы. Стандарт предлагает три типа отсылок:
Аскриптор – синоним дескриптора:
Первичные издания
см ПЕРВИЧНЫЕ ДОКУМЕНТЫ
2. Аскриптор, заменяемый комбинацией дескрипторов (используй комбинацию):
Русские тексты
исп к РУССКИЙ ЯЗЫК
ТЕКСТЫ
3. Аскрипторы, заменяемые несовместимыми дескрипторами (используй альтернативу):
Текущая информация
исп а СВЕДЕНИЯ
ТЕКУЩЕЕ ИНФОРМИРОВАНИЕ
Далее устанавливаются парадигматические отношения. Данный процесс включает:
Логический анализ.
Ассоциативный анализ.
Прагматический анализ.
Логический анализ – сопоставление объемов понятий, представленных дескрипторами:
ПРИКАЗЫ
вр ОРГАНИЗАЦИОННО_РАСПОРЯДИТЕЛЬНАЯ ДОКУМЕНТАЦИЯ (выше род)
ПРИКАЗЫ
нв ПРИКАЗЫ ПО ЛИЧНОМУ СОСТАВУ (ниже вид)
Ассоциативный анализ – сопоставление признаков предметов, входящих в определенные понятия, представленные дескрипторами.
КАТАЛОГ
вц НАУНО-СПРАВОЧНЫЙ АППАРАТ (выше целое)
АРХИВ
нч ОТДЕЛ (ниже часть)
Прагматический анализ – упорядочение структуры и состава словарной статьи дескриптора. Учитывает: область ИПТ, терминологические особенности отрасли знания
Структура дескрипторной статьи имеет вид:
Д {Мс; Мв; Мн; Ма}
где
Д – заглавный дескриптор;
Мс – множество аскрипторов, входящих в класс эквивалентности дескриптора;
Мв – множество вышестоящих дескрпиторов;
Мн – множество нижестоящих аскрипторов;
Ма – множество ассоциативных дескрпиторов.
Например для дескриптора:
АРХИВЫ
с АРХИВНЫЕ СЛУЖБЫ
АРХИВНЫЕ УЧРЕЖДЕНИЯ
в ИНФОРМАЦИОННЫЕ СЛУЖБЫ
н НАЦИОНАЛЬНЫЙ АРХИВ
РЕГИОНАЛЬНЫЙ АРХИВ
а СИСТЕМА АРХИВНОГО ОБСЛУЖИВАНИЯ
Для аскриптора:
АРХИВНЫЕ СЛУЖБЫ
см АРХИВЫ
Разработка вспомогательных указателей. Наиболее распространены три типа указателей: систематический указатель дескрипторов тезауруса, указатель иерархических отношений и пермутационный указатель дескрипторов. Систематический указатель – алфавитный список дескрипторов (тематический, категориальный, смешанный). Указатель иерархических отношений — свод классификационных деревьев. Каждый дескриптор может входить при этом более чем в одно дерево. Пермутационный указатель — перечень списков, каждый их которых соответствует одному из знаменательных слов в составе лексической единицы. Предназначен для поиска лексической единицы по отдельным словам.
Оформление ИПТ.
Экспертиза и регистрация ИПТ.
Основным способом уменьшения информационного шума является введение в ИПЯ грамматических средств, которые позволяют точно и полно выражать синтагматические отношения. Грамматические средства делятся на:
фрагментирующие. Для разделения поискового образа на части. К ним относятся указатели связи (буквы, цифры, знаки);
смыслоразличительные. Для указания смысловой роли различительных слов внутри фрагмента поискового образа. К ним относятся указатели роли.
ЛЕКЦИЯ 5