- •Оглавление
- •Исторические основы развития стандартизации.
- •Стандарты отраслей, предприятий и научно-технических объединений.
- •Методы стандартизации (унификация).
- •Правовые основы и основные задачи стандартизации.
- •Задачи и направление деятельности исо.
- •Комплексная стандартизация.
- •Главные направления развития стандартизации.
- •Организационная структура исо.
- •Опережающая стандартизация.
- •Нормативные документы по стандартизации.
- •Система предпочтительных чисел.
- •Правовая основа проведения государственного контроля и надзора.
- •Государственные стандарты.
- •Принципы стандартизации.
- •Цели и задачи государственного контроля и надзора.
- •Международные и региональные стандарты.
- •Методы стандартизации (симплификация, систематизация, классификация).
- •Порядок проведения государственного контроля и надзора.
- •Общероссийские классификаторы.
- •Методы стандартизации (агрегатирование, типизация).
- •Нормализационный контроль технической документации.
- •Исторические основы развития сертификации.
- •Оценка качества продукции.
- •Раздел 4 госТа 15467-79 устанавливает, что оценка качества продукции должна проводиться путем применения следующих методов:
- •Системы сертификации.
- •Основные цели сертификации. Термин «Сертификация».
- •Количественная оценка качества продукции (квалиметрия).
- •Схемы сертификации.
- •Основные объекты сертификации.
- •Системы качества по международным стандартам исо 9000.
- •Обязательное подтверждение соответствия.
- •Сертификация на международном, региональном и национальном уровнях.
- •Требования к системе управления качеством.
- •Обязательная сертификация.
- •Перечень продукции подлежащей обязательной сертификации
- •Защита прав потребителей.
- •Принципы управления качества.
- •Добровольная сертификация.
- •Контроль качества продукции.
- •Процессный подход к системе управления качеством.
- •Правила и порядок сертификации.
- •Информационно-поисковые системы. Основные проблемы информационного поиска. Основные информационно-поисковые режимы. Основные типы ипс.
- •1.2. Основные информационно-поисковые режимы
- •1.3. Основные типы ипс
- •Основные характеристики ипс. Первичные и вторичные параметры оценки ипс.
- •Основные элементы информационно-поискового языка. Классификация ипя.
- •Автоматическое рубрицирование.
- •Системы управления электронными документами. Разновидности носителей документов. Основные требования к системе управления электронными документами. Жизненный цикл документа.
- •Статические архивы. Задачи. Компоненты статического электронного архива. Основные технологические принципы построения электронного архива.
- •Динамические архивы. Регистро-ориентированные системы управления документооборотом.
- •Документная модель в Lotus Notes. Заметки. Элементы. Типы элементов. Типы заметок. Серверная часть Lotus Notes.
- •По промежуточного уровня и связь, именование и идентификаторы в Lotus Notes.
- •Схемы репликации в Lotus Notes. Разрешение конфликтов репликации в Lotus Notes.
Автоматическое рубрицирование.
Рубрицирование это процесс (метод), трансляции документа с ЕЯ на ИПЯ типа библиотечно-библиографической классификации (рубрикатора).
Методы автоматического рубрицирования, основанные на знаниях
Словарь ИПЯ представляет собой БЗ. Процесс создания словаря сходен с процессом разработки БЗ для экспертной системы (ЭС). Наиболее часто применяемые модели БЗ - модели семантической сети и продукционные.
Модель семантической сети
Строится тезаурус в виде сети понятий и отношений между ними. Основные этапы полуавтоматического синтеза тезауруса:
1) Автоматическая обработка большого объема документов при помощи программ морфологического и синтаксического анализа с целью выделения терминоподобных групп слов.
2) Исследование выделенных групп экспертами и принятие решений. Решения:
a. О включении группы в тезаурус (группа в этом случае приобретает статус термина);
b. О наличии синонимии для данного термина;
c. О наличии прочих отношений для данного термина.
Кроме тезауруса в информационный фонд системы рубрицирования может включаться:
• БД объектов предметной области, например география, организации, предприятия, персоналии и т.д.
• Обобщающее отношение К позволяет организовать тезаурус в виде иерархической структуры.
Процесс рубрицирования состоит в выделении из документа опорных дескрипторов и отношений между ними с последующий сопоставлением их с описанием рубрик.
Продукционная модель
БЗ представляет собой набор правил, определяющих понятия. В определении понятия может входить:
1) (обязательно!) набор слов и фраз, объединенных логическими отношениями;
2) Отношения следования и совместности между словами;
3) Веса и статистические характеристики слов.
Этапы процесса рубрицирования:
1. Выделение понятий из текста;
2. Принятие решения о принадлежности текста рубрике;
Недостатки рубрицирования, основанного на знаниях, аналогичны недостаткам специализированных ЭС;
- трудоемкость синтеза тезауруса;
- неуниверсальность тезауруса.
Автоматическое рубрицирование основанное на обучении по примерам
Эти методы основаны на обработке обучающих выборок, состоящих из документов, для которых указывается принадлежность к рубрикам. Методы этой группы делятся на статистические и нейросетевые.
Статистические методы
Здесь используется понятие терминологического портрета рубрики и документа, куда входят термины и их веса. Процесс обучения (формирования портретов рубрик) сводится к составлению экспертами выборок для каждой рубрики. Основные критерии формирования выборки:
- минимизация размеров текста;
- максимальная лингвистическая полнота;
- минимальная избыточность.
Выделение терминов производится автоматически. При этом формируется матрица их весов W=|w(tr)|, t - термин, r - рубрика
Рубрицирование документа выполняется по некоторому решающему правилу, например:
Sum(t) tf(t)w(tr)>k(r), , где
tf(t)- частота встречаемости термина t в рассматриваемом документе;
k(r)- пороговое значение для рубрики r.
Вектор порогов рубрик k(r) также формируется при обучении путем применении решающего правила к обучающей выборке и оценке результата с точки зрения критериев точности и полноты. При этом используются как математические методы, так и эмпирика.
Достоинства статистических методов:
- универсальность;
- наличие аппарата количественных оценок релевантности документов рубрикам;
- высокое быстродействие.
Недостатки:
- низкое качество рубрицирования по сравнению с методами, основанными на знаниях.
Нейросетевые методы
«-» - невозможность обоснования поведения НС;
«+» - более высокое качество, чем у статистических методов;