Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лингвистическое обеспечение.doc
Скачиваний:
7
Добавлен:
28.04.2019
Размер:
179.2 Кб
Скачать
  1. Фасетизация – методический прием разработки ипя.

Фасетная классификация- классификационная с-ма, в к-ой: понятия представлены в виде фасетной стр-ры, а классиф-онные индексы синтезируются посредством комбинирования фасетных признаков в соответствии с фасетной формулой.

Фасетный МЕ классиф-ции подразумевает, что множество объектов разделяется на независимые подмножества (классификационные группировки), обладающие определенными заданными признаками, необходимыми для решения конкретных задач.

Последовательность построения фасетной классиф-ции такая же, как и при построении иерархич классиф-ции:

- определяется множество объектов;

- выделяются основные признаки и группы признаков этого множества;

- выбирается порядок следования фасетов и признаков характеристик.

Порядок разработки:

- выделить основные признаки (характеристики), всесторонне характеризующие объект и обеспечивающие его идентификацию;

- сгруппировать их по принципу однородности в фасеты;

- присвоить им коды;

- определить фасетные формулы для образования подмножеств

При фасетном методе построения классификаторов подмножества формируются "от частного к общему".

Основными правилами при создании фасетной классификации являются:

- признаки в различных фасетах не пересекаются, т.е. каждый признак отличается от другого по наименованию, значению и кодовому обозначению;

- из общего числа фасетов, характеризующих множество объектов, выбираются фасеты, необходимые для решения поставленных задач, и устанавливается их строгая последовательность (фасетная формула)

Преимущества:

Возможно точное описание объектов в рамках выбранных признаков.

Количество признаков не ограничивается.

Список значений любого признака легко может пополняться.

Недостатки: Технология построения классификации (многочисленность признаков) подходит только для ограниченного круга однотипных или достаточно близких объектов. Классификации этого типа широко применяются в фактографических БД.

    1. Категориальный синтез. Принципы построения многочленных предметных рубрик.

Многочленные предметные рубрики состоят из основного заголовка и подзаголовков.

Основной (ведущий, главный) заголовок обозначает основной предмет документа (или один из основных предметов). Это могут быть конкретные или абстрактные понятия, как общие, так и единичные (см. приведенные далее примеры).

Проблемы создания предметных рубрик: Проблемы построения лексич состава ЯПР, в основном, обусловлены карточной формой предметных кат-гов, для орг-ции к-ых ЯПР были предложены. Однако проблемы 1 и 2 в той или иной степени характерны вообще для вербальных ИПЯ. 1. Выбор первого слова в простой предметной рубрике. 2. Выбор первого заголовка в многочленной предметной рубрике. 3. Порядок приведения подзаголовков в многочленной предметной рубрике. Выбор первого заголовка в многочленной предметной рубрике: Вопрос выбора первого заголовка тесно связан с понятием «основного предмета» текста документа. «Предмет – это все, что может быть объектом специального изучения» Порядок приведения подзаголовков в многочленной предметной рубрике: Существуют два основных подхода к структурированию многочленной ПР: 1) Первым заголовком (главным, ведущим) является тематический заголовок. В качестве подзаголовков использовать можно только географические, хронологические и формальные подзаголовки (позиция Библиотеки Конгресса США). 2) В составе многочленной ПР может быть несколько тематических подзаголовков наряду с географическими., хронологическими и формальными. В этом случае возникает проблема порядка следования тематических подзаголовков с составе ПР. Для определения порядка следования заголовков в многочленной ПР применяется дифференциация лексики по категориям. Создаются правила следования подзаголовков различных категорий для каждой отрасли знания.