- •Понятие информации
- •Способы представления информации
- •Понятие количества информации
- •Информационные процессы
- •Информационная техника и технология
- •Понятие архитектуры эвм
- •Основные компоненты архитектуры эвм:
- •Отличие структуры от архитектуры эвм
- •Соглашения и умолчания
- •Чего не может пк?
- •Формы адекватности информации и меры информации
- •Качество информации
- •Системы классификации (ск) Общие сведения
- •Иерархическая система классификации (иск)
- •Фасетная система классификации (фск)
- •Дескрипторная (описательная) система классификации (дск)
- •Системы кодирования (ск)
- •Классификация информации по разным признакам
- •По стадии обработки:
- •По способу отражения:
- •По стабильности:
- •По функции управления (для экономической и):
Дескрипторная (описательная) система классификации (дск)
Используется для организации поиска информации, для ведения тезаурусов (словарей). Язык ДСК приближается к естественному языку описания ИО. Особенно широко ДСК используется в библиотечной системе поиска. Суть ДСК заключается в следующем:
Отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы.
Выбранные ключевые слова и словосочетания подвергаются нормализации, т. е. из совокупности синонимов выбирается один или несколько наиболее употребимых.
Создается словарь дескрипторов, т. е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.
Пример. В качестве объекта классификации рассматривается успеваемость студентов. Ключевыми словами могут быть выбраны: оценка, экзамен, зачет, преподаватель, студент, семестр, название предмета. Здесь нет синонимов, и поэтому указанные ключевые слова можно использовать как словарь дескрипторов.
В качестве предметной области выбирается учебная деятельность в вузе. Ключевыми словами могут быть выбраны: студент, обучаемый, учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор, коллега, факультет, подразделение факультета, аудитория, комната, лекция, практическое занятие, коллоквиум и т. д. среди указанных ключевых слов встречаются синонимы, например: студент, обучаемый, учащийся; преподаватель, учитель, педагог; факультет, подразделение факультета и т. д. После нормализации словарь дескрипторов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, доцент, профессор, факультет, аудитория, лекция, практическое занятие и т. д.
Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:
синонимические, указывающие некоторую совокупность ключевых слов как синонимы;
родо – видовые, отражающие включение некоторого класса объектов в более представительный класс;
ассоциативные, соединяющие дескрипторы, обладающие общими свойствами.
Пример. Синонимическая связь: студент – учащийся – обучаемый. Родо – видовая связь: университет – факультет – кафедра. Ассоциативная связь: студент – экзамен – профессор – аудитория.
Системы кодирования (ск)
СК – совокупность правил кодового обозначения объектов.
СК применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.
Код строится на базе алфавита, состоящего из букв, цифр и других символов и характеризуется:
Длиной – числом позиций в коде;
Структурой – порядком расположения в коде символов, используемых для обозначения КП.
Процедура присвоения объекту кодового обозначения называется кодированием. Различают 2 типа СК:
Классификационная СК, ориентированная на проведение предварительной классификации объектов на основе ИСК либо ФСК. Различают:
Последовательное кодирование, используемое для ИСК, суть которого в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня и т.д. в результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне. Достоинства и недостатки те же, что и у ИСК;
Пример. Проведем кодирование информации, представленной на рис 3. (Пример ИСК для ИО "Факультет"). Количество кодовых группировок определяется глубиной классификации и равно 4. Выберем 10-ную СС. Длина кода равна 4 десятичным разрядам. В общем виде – ХХХХ, где Х – значение десятичного разряда. 1-й (старший) разряд – для КП "название факультета" и имеет значения: 1 – коммерческий, 2 – машиностроительный и т.д.; 2-й разряд – для КП "возраст" (1- до 20 лет, 2 – 20 до 30 лет, 3 – свыше 30 лет); 3-й разряд – для КП "пол" (1 – мужчины, 2- женщины); 4-й разряд – для КП "наличие детей у женщин" (0 – для мужчин, 1 – есть дети, 2 – нет детей). Например: 1310 – студенты коммерческого факультета, свыше 30 лет, мужчины.
Параллельное кодирование, используемое для ФСК, суть которого в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. . Достоинства и недостатки те же, что и у ФСК;
Пример. Проведем кодирование информации, представленной на рис. 5. (пример ФСК для ИО"Факультет"). Количество кодовых группировок определяется количеством фасетов и равно 4. Выберем 10-ную СС. Длина кода равна 4 десятичным разрядам. Порядок кодировки фасетов не имеет значения. В общем виде – ХХХХ, где Х – значение десятичного разряда. 1-й (старший) разряд – для фасета "пол" (1 – мужчины, 2- женщины); 2-й разряд – для фасета "наличие детей у женщин" (0 – для мужчин, 1 – есть дети, 2 – нет детей); 3-й разряд – для фасета "возраст" (1- до 20 лет, 2 – 20 до 30 лет, 3 – свыше 30 лет); 4-й разряд – для название "факультета" и имеет значения: 1 – радиотехнический, 2 – машиностроительный и т.д.). например: 2135 – женщины в возрасте свыше 30 лет, имеющие детей и являющиеся студентками математического факультета.
Регистрационная СК используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают:
Порядковое кодирование, предполагающее последовательную нумерацию объектов натуральными числами. Порядок может быть случайным или определяться после упорядочивания объектов, например по алфавиту. Применяется, когда количество объектов невелико (например, кодирование названий факультетов);
Серийно- порядковое кодирование с предварительным выделением групп объектов, составляющих серию. Каждая серия и объекты внутри серии нумеруются по порядку. Применяется при небольшом количестве групп.
Пример. Студенты факультета разбиты на группы (серии). Группы нумеруются по порядку. Внутри группы фамилии студентов упорядочены по алфавиту и каждому студенту присвоен номер.