Максимов Информационные ресурсы и поисковые системы 2008
.pdfбольшой группы дескрипторов, перечень которых в словарной статье не приводится, перед обозначением помещается символ «*» – «*РТ» («*ВТ»):
АЦЕТАЛЬДЕГИД
UF уксусный альдегид UF этаналь
UF этилальдегид *BT1 альдегиды RT ацеталь
RT хлораль
Дескрипторы, нижестоящие по отношению к заглавному дескриптору (видовые), вводятся в дескрипторную статью со ссылкой «ВТ» (англоязычный вариант – NТ). Этой ссылкой обозначаются как видовые дескрипторы, так и дескрипторы, обозначающие компонент (часть) понятия, выраженного заглавным дескриптором:
ПОГЛОЩЕНИЕ
UF торможение (в веществе) BT1 сорбция
NT1 k-поглощение
NT1 всасывание в кишечнике
NT1 поглощение корнями
NT1 поглощение полярной шапкой NT1 поглощение через кожу
NT1 поглощение энергии NT1 резонансное поглощение NT1 самопоглощение
RT абсорбционная спектроскопия
RT абсорбционный цикл охлаждения RT гетерогенные эффекты
RT замедление
RT излучения
RT пробег
RT пропускание
RT самоэкранирование
RT слой половинного поглощения RT спектры поглощения
RT тормозная способность RT точечные ядра
RT экранирование
141
Цифры 1, 2, 3, стоящие после обозначений РТ (ВТ) и ВТ (NТ), указывают на соответствующий уровень подчинения:
УСКОРИТЕЛИ
NT1 когерентные ускорители
NT1 коллективные ускорители
NT2 плазменные бетатроны
NT2 ускорители с фронтом ионизации
NT2 ускорители электронных колец NT1 линейные ускорители
NT2 квадрупольные лин. ускорители NT2 линейные ускорители тяжелых ионов
NT3 сверхпроводящий линейный ускоритель atlas NT3 суперхайлак
NT2 линейный уск-ль тяжелых ионов с перестройкой частоты NT2 линейный ускоритель fmit
NT2 линейный ускоритель jaeri NT2 линейный ускоритель kek NT2 линейный ускоритель lampf NT2 линейный ускоритель mea NT2 линейный ускоритель mit bates NT2 линейный ускоритель nrl
NT2 линейный ускоритель orela
NT2 линейный ускоритель на 200 мэв бнл NT2 линейный ускоритель орсэ
NT2 линейный ускоритель протонов beijing NT2 линейный ускоритель сакле
NT2 линейный ускоритель свирк NT2 линейный ускоритель фраскатти NT2 линейный ускоритель хфти NT2 линейный ускоритель церн
NT2 станф. лин. ускор. на энергию 1,2 гэв NT2 станфордский лу на 20 гэв
NT2 универсальный линейный ускоритель unilac NT2 ускорители на волнах биения
NT2 ускорители с использованием спут-ого поля
NT2 усовершенствованный испытательный ускоритель нллл NT2 установка на основе ускорителя с непрерывным элек-
трич. пучком
NT2 электрон-позитронный коллайдер beijing NT1 мезонные фабрики
NT2 линейный ускоритель lampf
142
NT2 синхротрон lampf ii
NT2 установки для медицин-го обсл-ния с использованием пионов
NT1 рельсовые ускорители
NT1 ускорители для термоядерного синтеза NT1 ускорители тяжелых ионов
NT2 коллайдер релятивистских тяжелых ионов бнл NT2 линейные ускорители тяжелых ионов
NT3 сверхпроводящий линейный ускоритель atlas NT3 суперхайлак
NT2 линейный уск-ль тяжелых ионов с перестройкой частоты NT2 миланский сверхпроводящий циклотрон
NT2 мюнхенский свсе циклотрон NT2 сверхпроводящий циклотрон crnl NT2 синхротрон sis
NT2 техасский сверхпроводящий циклотрон NT2 универсальный линейный ускоритель unilac NT2 ускоритель hhirf
NT2 ускоритель vicksi NT2 ускоритель нуматрон NT2 циклотрон ganil NT2 циклотрон hirfl
NT2 циклотрон kvi
NT2 циклотрон u-120 в кракове NT2 циклотрон в варшаве NT2 циклотрон в калькутте
NT2 циклотрон института физичеких и химических исследований (ифх)
NT2 циклотрон иссл-го центра ядер-й физики (унив-т в осака) NT2 циклотрон нуц, юар
NT2 циклотрон токийского ин-та ядерных иссл-ий NT2 циклотрон тохоку
NT2 циклотрон у-400 оияи
NT2 циклотрон циклон
NT1 циклические ускорители NT2 бевалак
NT2 бетатроны
NT2 синхротроны
NT3 беватрон
NT3 кембриджский ускоритель электронов сша NT3 корнеллский синхротрон на 10 гэв
143
NT3 космотрон
NT3 накопительное кольцо cosy NT3 накопительное кольцо escar NT3 накопительные кольца lep
NT3 принстон-пенсильванский синхротрон NT3 сверхпроводящие суперколлайдеры NT3 серпуховской тэватрон
NT3 синхротрон ags бнл NT3 синхротрон ipns-i NT3 синхротрон lampf ii NT3 синхротрон lusy NT3 синхротрон mura
NT3 синхротрон ps в церне NT3 синхротрон sis
NT3 синхротрон sps NT3 синхротрон zgs
NT3 синхротрон боннского университета NT3 синхротрон в пахре
NT3 синхротрон ефти
NT3 синхротрон итэф
NT3 синхротрон ифвэ
NT3 синхротрон кек
NT3 синхротрон лаборатории во фраскатти NT3 синхротрон оияи
NT3 синхротрон токийского ун-та
NT3 синхротрон томского университета NT3 синхротрон фиан
NT3 тэватрон лаборатории им. ферми NT3 ускоритель desy
NT3 ускоритель nimrod NT3 ускоритель nina NT3 ускоритель saturne NT3 ускоритель saturne ii
NT3 ускорительный комплекс nal NT2 синхроциклотроны
NT3 синхротрон iko
NT3 синхроциклотрон uppsala NT3 синхроциклотрон в беркли NT3 синхроциклотрон в орсэ NT3 синхроциклотрон в церне
NT3 синхроциклотрон гарвардского университет
144
NT3 синхроциклотрон мак-гилла NT3 синхроциклотрон оияи NT3 синхроциклотрон харуэлл NT2 циклотроны
NT3 изохронные циклотроны
NT4 изохронный циклотрон орнл
NT4 казахстанский циклотрон NT4 киевский циклотрон
NT4 миланский сверхпроводящий циклотрон NT4 мюнхенский компактный циклотрон NT4 мюнхенский свсе циклотрон
NT4 принстон-пенсильванский циклотрон NT4 сверхпроводящий циклотрон crnl
NT4 техасский сверхпроводящий циклотрон NT4 циклотрон, юлих
NT4 циклотрон aabo
NT4 циклотрон aic-144 в кракове NT4 циклотрон alice
NT4 циклотрон ganil NT4 циклотрон hirfl NT4 циклотрон iu NT4 циклотрон kvi NT4 циклотрон nirs NT4 циклотрон nrl
NT4 циклотрон sara (система уск-лей в роун-альпе) NT4 циклотрон sin
NT4 циклотрон triumf
NT4 циклотрон агро-механического колледжа NT4 циклотрон бнл
NT4 циклотрон в варшаве
NT4 циклотрон в гренобле
NT4 циклотрон в дебрецине
NT4 циклотрон в карлсруэ NT4 циклотрон в орсэ NT4 циклотрон в осло
NT4 циклотрон в эйндховене NT4 циклотрон гайзи
NT4 циклотрон института физичеких и химических исследований (ифх)
NT4 циклотрон иссл-го центра ядер-й физики (унив-т в осака) NT4 циклотрон ияи (шанхай)
145
NT4 циклотрон нуц, юар
NT4 циклотрон токийского ин-та ядерных иссл-ий NT4 циклотрон тохоку
NT4 циклотрон циклон NT4 циклотроны msu NT4 циклотроны uclrl
NT5 88-дюймовый циклотрон в ллб NT4 циклотроны оияи
NT5 циклотрон у-400 оияи NT3 микротроны
NT4 рейстрек-микротроны
NT3 сверхпроводящие циклотроны
NT4 миланский сверхпроводящий циклотрон NT4 техасский сверхпроводящий циклотрон NT3 циклотрон u-120 в кракове
NT3 циклотрон ин-та нильса бора
NT3 циклотроны с переменной энергией NT4 циклотрон в калькутте
NT4 циклотрон в чандигаре
NT3 циклотроны с разделенными орбитами NT1 электростатические ускорители
NT2 динамитроны
NT2 тандемные электростатические ускорители NT3 тандемный ускоритель вивитрон
NT3 тандемный ускоритель ияи японии NT3 тандемный ускоритель мр
NT3 тандемный ускоритель орсе
NT2 ускорители ван-де-граафа
NT3 тандемный ускоритель вивитрон NT3 тандемный ускоритель ияи японии NT3 тандемный ускоритель мр
NT3 тандемный ускоритель орсе
NT2 ускорители кокрофта-уолтона NT2 ускорители-пеллетроны NT3 ускоритель-пеллетрон 5u RT бустеры
RT вакуумные системы RT динамика пучка
RT драйверы ударных реакций синтеза RT мишенные камеры
RT накопительные кольца
146
RT поглотители пучка RT производство изотопов RT сепараторы пучков RT ускорение
RT ускорители-размножители
RT ускорительный комплекс
Дескрипторы, связанные с заглавным дескриптором другими видами отношений, включены в дескрипторную статью со ссылкой «AT», обозначающей ассоциацию (англоязычный вариант – RT).
АБСОРБЦИОННАЯ СПЕКТРОСКОПИЯ
UF атомная абсорбционная спектроскопия UF колориметрия
SF спектрохимия
BT1 спектроскопия
RT инфракрасные спектры
RT лазерная спектроскопия
RT методы двойного резонанса RT поглощение
RT спектры крайнего ультрафиолетового излучения RT спектры поглощения
RT структурный химический анализ RT ультрафиолетовые спектры RT фотоакустические спектрометры
В табл. 4.2 приведены возможные связи между дескрипторами и ключевыми словами в тезаурусе INIS с указаниями типа отношения.
|
|
Связи в тезаурусе |
Таблица 4.2 |
|
|
|
|
||
|
|
|
|
|
Обозначение |
Название |
Тип отношения |
||
Рус. |
Англ. |
|||
|
|
|||
см. |
SEE |
смотри |
синонимия |
|
см. вместо |
SF |
смотри вместо |
синонимия |
|
исп. |
USE |
используй |
синонимия |
|
исп. вместо |
UF |
используй вместо |
синонимия |
|
РТ |
BT |
вышестоящий |
иерархия |
|
ВТ |
NT |
нижестоящий |
иерархия |
|
АТ |
RT |
ассоциативный |
ассоциация |
|
|
|
147 |
|
Характеристика словарного состава Тезауруса. Лексика тезауруса может быть представлена множеством терминов
V={M1M2M3M4M5M6 },
которое включает следующие подмножества [14]:
M1 – ненормализованные термины (недескрипторы), которые являются условными или истинными синонимами дескрипторов.
M2 – дескрипторы без связей, т.е. понятия, для которых фиксация в тезаурусе родо-видовых отношений была признана нецелесообразной. К данному подмножеству относятся также категории – широкие понятия, которые не входят ни в какие более широкие понятия, и, кроме того, единичные понятия, отражающие признаки како- го-либо одного предмета и не имеющие видового развития.
M3 – родоначальные дескрипторы. К родоначальным деск-
рипторам относятся дескрипторы понятий, которые не имеют в тезаурусе родового развития, но имеют подчиненные видовые понятия. Эти дескрипторы являются корнями иерархических деревьев.
M4 – видовые дескрипторы первого уровня.
M5 – видовые дескрипторы второго уровня.
M6 – видовые дескрипторы третьего и низшего уровней.
Иерархические структуры в тезаурусе могут иметь несколько уровней, и на каждом из них возможно отражение выделенных при анализе понятий, что позволяет описывать содержание предмета по тематике тезауруса с различной степенью специфичности.. Однако для большинства родо-видовых семейств в тезаурусе характерно развитие до первого и второго видовых уровней.
На I-м уровне специфичности находятся дескрипторы без связей и дескрипторы родоначальных понятий. Эта величина характеризует предметную широту тезауруса – представление в нем различных понятий.
148
II-й уровень специфичности, основу тезауруса, составляют дескрипторы без связей, дескрипторы родоначальных понятий и дескрипторы видовых понятий первого уровня.
Специфичность описания документа или запроса можно увеличить последовательным расширением используемой лексики до видовых понятий II (III уровень специфичности) и низших уровней (IV уровень специфичности). Объем словарного состава при этом увеличивается до 90% и 100% соответственно.
Способность языка индексирования отражать понятия в точном соответствии с тем объемом, с каким они выделены при анализе предметного содержания, характеризуется его специфичностью. Для тезауруса с развитой иерархией понятий специфичность может быть приближенно оценена степенью развития иерархических связей.
Полнота индексирования определяется возможностью перевода на ИПЯ всех понятий, выявленных при анализе содержания предмета в заданной тематической области, и зависит, таким образом, от наличия в языке дескрипторов, представляющих эти понятия, т. е. от предметной широты тезауруса.
Развитие иерархических связей входного словаря, а также предметная широта тезауруса характеризуют его «семантическую силу», определяемую как «способность точно и полно выражать смысл любого сообщения».
Иерархические деревья понятий в тезаурусе отличаются как по числу иерархических уровней, так и по количеству видовых по-
нятий на различных уровнях. Степень развития иерархической структуры тезауруса можно оценить отношением числа всех дескрипторов к числу разных понятий:
I M2 M3 M4 M5 M6 .
M2 M3
Степень развития входного словаря, а следовательно, и возможности тезауруса по переводу содержания текстов по его тематике с естественного языка на ИПЯ ( индексирование ) можно оценить с помощью коэффициента синонимии :
Sn M1 . V
149
Обзор правил и методов построения тезауруса. Построе-
ние тезауруса включает в себя следующие этапы.
1.Определение тематического охвата информационнопоискового тезауруса путем анализа информационной потребности абонентов (потребителей).
2.Сбор массива лексических единиц в том случае, если отсутствуют тезаурусы по заданной тематике. Первоначальный сбор лексики осуществляется выделением лексических единиц из представленной коллекции документов и/или запросов. В полученный массив лексических единиц дополнительно должны быть включены соответствующие тематике лексические единицы, выделенные
всоответствии с методикой построения данного тезауруса из указанных в ней источников: рубрикатора ГРНТИ; энциклопедических и терминологических словарей, справочников; терминологических стандартов; классификаторов технико-экономической информации; таблиц УДК, МКИ и других систем классификации.
3.Формирование словника тезауруса. В словник могут быть включены следующие типы лексических единиц:
- одиночные слова (существительные, прилагательные, глаголы, наречия, причастия);
- именные словосочетания; - лексически значимые компоненты сложных слов;
- аббревиатуры; при наличии аббревиатур в словник должны включаться также соответствующие им полные формы (если только она не отсутствует).
- сокращения слов и словосочетаний.
Одиночные существительные следует заменять формой именительного падежа. Формы прилагательных и причастий следует приводить к именительному падежу. Прилагательные и причастия
вединственном числе приводятся к форме мужского рода. Глаголы рекомендуется заменять отглагольными существительными. Глаголы, включенные в словник, приводят к форме инфинитива.
4.Построение словарных статей. При построении словарных статей информационно-поискового тезауруса лексическим единицам приписываются ссылки, устраняется неоднозначности ЛЕ, устанавливаются отношения эквивалентности, выбирается дескриптор, представляющий класс эквивалентности при индексиро-
150