Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Голицына Информационные системы 2004.pdf
Скачиваний:
323
Добавлен:
16.08.2013
Размер:
5.01 Mб
Скачать

ющиеся кроме того по сути своей номинальными определениями индексируемых объектов (т.е. материалов, способов, устройств, являющихся предметами изобретения). Выбор именно такого типа лексических единиц обеспечивает единообразную трактовку содержания рубрик, независимо от особенностей употребления специальной научно-технической терминологии для различных научных школ и языков. Эта атерминологичность частично компенсируется введением в рубрику дополнительных видовых понятий при построении классификации за счет построения алфавитно-предметных указателей в классификации изобретений.

Среди недостатков построения МКИ отмечают также нелогичность выделения составных частей, внесение отдельных разделов в другие, некорректности отнесения классов к разделам, подгрупп к группам, смешение целого и части, отсутствие четко обозначенных отношений.

5.3.3. Отраслевые классификационные системы

Среди наиболее используемых в настоящее время отраслевых классификаций научной информации необходимо отметить Государственный рубрикатор научно-технической информации (ГРНТИ) и номенклатуру специальностей Высшей аттестационной комиссии (ВАК РФ).

Государственный рубрикатор НТИ и локальные (или отраслевые) рубрикаторы, построенные на его основе, используются при формировании всех видов информационных изданий. Систематизация документов в издании осуществляется в соответствии с последовательностью расположения рубрик, описывающих тематику издания.

Государственный рубрикатор научно-технической информации

(ГРНТИ, прежнее наименование — Рубрикатор ГАСНТИ) представляет собой универсальную иерархическую классификацию областей знания, принятую для систематизации всего потока научно-технической информации.

Рубрикатор имеет три уровня иерархии. Коды рубрик состоят из пар арабских цифр, разделенных точкой.

Рубрикам (в качестве справочной информации) поставлены в соответствие индексы Универсальной десятичной классификации (УДК) и коды Номенклатуры специальностей научных работников (ВАК). Это обеспечивает взаимосвязь между классификационными системами, а также возможность поиска документов в информационных массивах и базах данных, систематизированных по УДК и номенклатуре специальностей ВАК. На основе Рубрикатора построена система локальных (отраслевых, тематических, проблемных) рубрикаторов в органах научно-технической информации.35

35 Рубрикатор является частью общесистемных средств лингвистического обеспечения, в состав которых также входят: комплекс базисных тезаурусов, номенклатура грамматических средств ИПЯ,

169

правила представления данных в коммуникативных форматах, методики индексирования для обмена информационными материалами в режиме сети.

170

В основные функции Рубрикатора входит:

-определение тематического охвата информационных служб, систем, банков и баз данных;

-формирование информационных массивов с целью последующего обмена;

-систематизация материалов в информационных изданиях;

-индексирование документов и поиска их по тематическим рубрикам;

-переадресация запросов в информационных сетях;

-выполнение нормативной функции при разработке и совершенствовании локальных рубрикаторов;

-выполнение функции языка-посредника между другими классификационными системами (УДК, ББК и др.), используемыми в автоматизированных информационных системах.

Реализация этих функций позволяет:

-минимизировать дублирование при обработке документов и запросов;

-повысить эффективность информационного обслуживания в традиционном и автоматизированном режимах;

-минимизировать затраты при формировании информационных массивов;

-унифицировать структуру локальных рубрикаторов и обеспечить их совместимость в рамках сети;

-обеспечить совместимость тематического описания информационных ресурсов при работах по межгосударственному сотрудничеству в рамках СНГ;

-унифицировать методы ведения локальных рубрикаторов;

-упорядочить тематическую структуру информационных систем

ибаз данных;

-вести статистический анализ информационных массивов и потоков и т. д.

Принципы разработки Рубрикатора. При разработке Рубрикатора соблюдались следующие основные принципы и требования.

Рубрикатор имеет многоцелевое назначение, отвечает потребностям всех информационных органов в силу универсальности охвата тематики, обеспечивает многофункциональное использование.

Рубрикатор является иерархической классификацией и построен так, что классы одного уровня, как правило, не пересекаются, а понятия одного уровня находятся в состоянии подчинения к понятию более высокого уровня, например:

73 Транспорт

73.29 Железнодорожный транспорт

171

73.31 Автомобильный транспорт

73.34 Водный транспорт

73.37 Воздушный транспорт

73.39 Трубопроводный транспорт

Признаком, по которому проведено деление класса «73 Транспорт», является признак отнесения к видам технических средств перевозки. Перечисленные виды транспорта не пересекаются, а в совокупности составляют класс "Транспорт" — обобщенное понятие более высокого уровня иерархии.

В Рубрикаторе использовано сочетание иерархии с фасетным принципом, который проявляется в наличии совокупности рубрик, повторяющейся в разных классах в виде группы "Общие вопросы", а также в применении типовых классификационных делений в разных разделах Рубрикатора. Например, фасет "Общие вопросы" имеет одинаковую структуру в разных классах:

59 Приборостроение

73 Транспорт

59.01 Общие вопросы

73.01 Общие вопросы

59.01.17

Международное сотрудничество

73 .01.17 Международное сотрудничество

59.01.29

Информационная деятельность

73.01.29 Информационная деятельность

59.01.79

Кадры

73.01.79 Кадры

Для исключения дублирования разделы Рубрикатора включают тематическое "ядро" предметной области, оснащенное ссылками на связанные с ним смежные вопросы, помещенные в других тематически близких разделах Рубрикатора.

Уровень рубрики, соответствующей определенной области знания, отражает не ее значимость, а только степень обобщения при логической группировке понятий. В пределах одного уровня располагаются примерно равнозначные по объему понятия. Иерархическое строение Рубрикатора, реализованное при упорядочении понятий, отражено в нотации: количество двухразрядных цифровых элементов кода рубрики соответствует иерархическому уровню класса, например.

70 Водное хозяйство

(1 уровень)

70.21 Оросительные системы

(2 уровень)

70.21.31 Виды орошения

(3 уровень)

Наряду с иерархической классификационной структурой в Рубрикаторе с помощью ссылок отражаются полииерархические связи, т.е. подчинение одного понятия двум или более классам, размещенным в разных местах иерархии. При этом могут указываться аспекты, уточняющие признаки деления понятий, например:

60.31 Репрография См. также 13.20.31 Техническое оснащение библиотек

Система нотаций строится на единых принципах и обеспечивает введение новых рубрик без изменения имеющихся кодов.

172

Рубрикатор обеспечивает отнесение каждого документа к минимально необходимому числу рубрик, поскольку между рубриками, имеющими логико-семантические связи, существуют разграничения аспектов, отраженных в наименованиях рубрик, примечаниях и ссылках.

Структура Рубрикатора. Рубрикатор имеет 3 уровня иерархии, при этом весь универсум знаний условно разделен на 4 подкласса:

- «Общественные науки» (значение кода первого уровня от 00 до

26);

-«Естественные и точные науки» (значение кода первого уровня от 27 до 43);

-«Технические и прикладные науки. Отрасли экономики» (значение кода первого уровня от 44 до 81);

-«Межотраслевые и комплексные проблемы» (значение кода первого уровня от 82 до 90).

Каждая рубрика состоит из кода (нотации) и наименования (описание класса), а также может иметь при себе ссылки и примечания.

На каждом уровне Рубрикатора возможно деление на 100 подклассов. Коды рубрик состоят из цепочки пар арабских цифр, разделенных точкой. В конце кода точка не ставится.

Наименование рубрики представляет собой текст, отражающий ее смысловое содержание, например:

37.23.31 Моделирование климата. Прогноз климата.

Аппарат ссылок и примечаний при рубрике отражает наличие полииерархических связей между рубриками, способствует уточнению и разграничению содержания рубрик, а также адекватному отнесению документов к релевантным рубрикам при индексировании.

Используются следующие виды ссылок:

Смотри ("см.") - содержит наименование понятия или темы, не находящей отражения в данной рубрике, и одновременно указывает ее место в рубрикаторе, например:

19.21 Массовая коммуникация. Социология массовой коммуникации

см. 04.51.54 Социология информации и коммуникации

Отсылка от ("Отс. от") - является обратной к ссылке "см." и ставится при рубрике, на которую имеется ссылка "см.":

66.15.17 Валка леса. Выборочные рубки и рубки ухода см. 68.47.29 Лесопользование 68.47.29 Лесопользование Ост. от 66.15.17 Валка леса

173

Смотри также ("См. также") - отражает частичное пересечение содержания между рубриками, симметрична и присутствует в обеих связанных рубриках:

38.36.17 Кристаллография минералов См. также 31.15.17 Кристаллохимия и кристаллография

31.15.17 Кристаллохимия и кристаллография См. также 38.35.17 Кристаллография минералов

Эквивалентно ("Экв.") - используется для указания случаев тождественного наименования двух рубрик в разных разделах рубрикатора и также является симметричной, например:

15.81.43 Военная психология 78.21.15 Военная психология Экв. 78.21.15 Экв. 15.81.43

При рубрике может быть дополнительная помета в виде текста ("Примечание"), которая конкретизирует тематическое содержание рубрики, уточняет порядок расположения материала на более глубоком уровне иерархии, заменяет группу однотипных ссылок либо представляет собой комбинацию перечисленных случаев:

34.33 Зоология Примечание. В рубрике отражаются вопросы систематики,

фаунистики, морфологии, физиологии и экологии (по видам животных)

Связь с другими классификациями. Каждой рубрике в качестве справочной информации также приписаны индексы УДК и Номенклатуры ВАК. Соблюдение структурной и терминологической эквивалентности при этом являлось не обязательным. Сопоставление классов классификационных систем осуществлялось на понятийном уровне, с учетом аспекта рассмотрения понятия.

При сопоставлении с УДК в первую очередь используетя простой индекс, а при его отсутствии — комбинированный (сложный или составной):

10.07.53 Теория государства УДК 321.01 50.05.09 Языки программирования УДК 004.43; 811.93

61.39.51 Люминесцентные органические красители. Оптические отбеливатели

УДК 667.28:661.143; 667.28:535.683

Для организации связи с Номенклатурой ВАК рубрикам сопоставлены коды по Номенклатуре специальностей научных работников Высшей аттестационной комиссии России. Так же, как и при сопоставлении с УДК, рубрикам приписывается один, либо несколько кодов специальностей по Номенклатуре ВАК, разделенных точкой с запятой. Если при этом специальность ВАК заведомо не исчерпывает тематику рубрики, перед кодом специальности ставится знак плюс:

174

27.15 Теория чисел ВАК 01.01.06 28.23.13 Инженерия знаний. Представление знаний ВАК 05.13.01;

05.13.17; 05.25.05 29.17.27 Жидкие металлы и полупроводники ВАК +01.04.07;

+01.04.10

Локальный рубрикатор строится как выборка произвольного множества рубрик Государственного рубрикатора НТИ с возможным дальнейшим развитием на глубину ниже третьего уровня. Глубина классификации разрабатываемого рубрикатора не ограничивается и определяется информационной потребностью органа НТИ. При этом разные рубрики могут быть развиты на разную глубину. Отобранные рубрики Рубрикатора переносятся в локальный рубрикатор без изменения кода и наименования. Рубрики в локальном рубрикаторе располагаются также в порядке возрастания кодов.

При многоаспектном индексировании каждое понятие и аспект должны быть выражены кодами рубрик Рубрикатора. При этом для адекватного и полного отражения содержания рекомендуется использовать коды рубрик более низкого уровня обобщения (глубоких уровней иерархии). Использование рубрик первого уровня для индексирования документов не допускается.

Для отражения в поисковом образе политематического многоаспектного содержания документа может быть использовано "блочное" индексирование. Блок отражает только одну тему документа. В зависимости от количества выделенных при анализе содержания тем поисковый образ может состоять из одного или нескольких блоков.

Каждый блок включает основной код рубрики, отражающий главную тему документа, и дополнительные коды рубрик, которые отражают аспекты рассмотрения темы. Основной код ставится на первое место. Минимальный блок состоит из одного кода. Если блок содержит более одного кода, то они отделяются запятой, например:

Документ "Борьба с вредителями при выращивании зерновых культур".

Для индексирования используются рубрики: 68.35.29, 68.37.29 где:

68.35.29 Зерновые культуры 68.37.29 Вредители сельскохозяйственных растений и борьба с

ними.

В Приложении 2 приведен раздел Рубрикатора ВИНИТИ РАН «20 Информатика».

175