Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Материал для контрольной работы (теория).doc
Скачиваний:
0
Добавлен:
26.08.2019
Размер:
219.14 Кб
Скачать

Дескрипторная (описательная) система классификации (дск)

Используется для организации поиска информации, для ведения тезаурусов (словарей). Язык ДСК приближается к естественному языку описания ИО. Особенно широко ДСК используется в библиотечной системе поиска. Суть ДСК заключается в следующем:

  1. Отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы.

  2. Выбранные ключевые слова и словосочетания подвергаются нормализации, т. е. из совокупности синонимов выбирается один или несколько наиболее употребимых.

  3. Создается словарь дескрипторов, т. е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

Пример. В качестве объекта классификации рассматривается успеваемость студентов. Ключевыми словами могут быть выбраны: оценка, экзамен, зачет, преподаватель, студент, семестр, название предмета. Здесь нет синонимов, и поэтому указанные ключевые слова можно использовать как словарь дескрипторов.

В качестве предметной области выбирается учебная деятельность в вузе. Ключевыми словами могут быть выбраны: студент, обучаемый, учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор, коллега, факультет, подразделение факультета, аудитория, комната, лекция, практическое занятие, коллоквиум и т. д. среди указанных ключевых слов встречаются синонимы, например: студент, обучаемый, учащийся; преподаватель, учитель, педагог; факультет, подразделение факультета и т. д. После нормализации словарь дескрипторов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, доцент, профессор, факультет, аудитория, лекция, практическое занятие и т. д.

Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:

  1. синонимические, указывающие некоторую совокупность ключевых слов как синонимы;

  2. родо – видовые, отражающие включение некоторого класса объектов в более представительный класс;

  3. ассоциативные, соединяющие дескрипторы, обладающие общими свойствами.

Пример. Синонимическая связь: студент – учащийся – обучаемый. Родо – видовая связь: университет – факультет – кафедра. Ассоциативная связь: студент – экзамен – профессор – аудитория.

Системы кодирования (ск)

СК – совокупность правил кодового обозначения объектов.

СК применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.

Код строится на базе алфавита, состоящего из букв, цифр и других символов и характеризуется:

  1. Длиной – числом позиций в коде;

  2. Структурой – порядком расположения в коде символов, используемых для обозначения КП.

Процедура присвоения объекту кодового обозначения называется кодированием. Различают 2 типа СК:

  1. Классификационная СК, ориентированная на проведение предварительной классификации объектов на основе ИСК либо ФСК. Различают:

  1. Последовательное кодирование, используемое для ИСК, суть которого в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня и т.д. в результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне. Достоинства и недостатки те же, что и у ИСК;

Пример. Проведем кодирование информации, представленной на рис 3. (Пример ИСК для ИО "Факультет"). Количество кодовых группировок определяется глубиной классификации и равно 4. Выберем 10-ную СС. Длина кода равна 4 десятичным разрядам. В общем виде – ХХХХ, где Х – значение десятичного разряда. 1-й (старший) разряд – для КП "название факультета" и имеет значения: 1 – коммерческий, 2 – машиностроительный и т.д.; 2-й разряд – для КП "возраст" (1- до 20 лет, 2 – 20 до 30 лет, 3 – свыше 30 лет); 3-й разряд – для КП "пол" (1 – мужчины, 2- женщины); 4-й разряд – для КП "наличие детей у женщин" (0 – для мужчин, 1 – есть дети, 2 – нет детей). Например: 1310 – студенты коммерческого факультета, свыше 30 лет, мужчины.

  1. Параллельное кодирование, используемое для ФСК, суть которого в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. . Достоинства и недостатки те же, что и у ФСК;

Пример. Проведем кодирование информации, представленной на рис. 5. (пример ФСК для ИО"Факультет"). Количество кодовых группировок определяется количеством фасетов и равно 4. Выберем 10-ную СС. Длина кода равна 4 десятичным разрядам. Порядок кодировки фасетов не имеет значения. В общем виде – ХХХХ, где Х – значение десятичного разряда. 1-й (старший) разряд – для фасета "пол" (1 – мужчины, 2- женщины); 2-й разряд – для фасета "наличие детей у женщин" (0 – для мужчин, 1 – есть дети, 2 – нет детей); 3-й разряд – для фасета "возраст" (1- до 20 лет, 2 – 20 до 30 лет, 3 – свыше 30 лет); 4-й разряд – для название "факультета" и имеет значения: 1 – радиотехнический, 2 – машиностроительный и т.д.). например: 2135 – женщины в возрасте свыше 30 лет, имеющие детей и являющиеся студентками математического факультета.

  1. Регистрационная СК используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают:

  1. Порядковое кодирование, предполагающее последовательную нумерацию объектов натуральными числами. Порядок может быть случайным или определяться после упорядочивания объектов, например по алфавиту. Применяется, когда количество объектов невелико (например, кодирование названий факультетов);

  2. Серийно- порядковое кодирование с предварительным выделением групп объектов, составляющих серию. Каждая серия и объекты внутри серии нумеруются по порядку. Применяется при небольшом количестве групп.

Пример. Студенты факультета разбиты на группы (серии). Группы нумеруются по порядку. Внутри группы фамилии студентов упорядочены по алфавиту и каждому студенту присвоен номер.