Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Диссертация по мат.семантике.doc
Скачиваний:
16
Добавлен:
07.11.2018
Размер:
2.47 Mб
Скачать

1.2.2. Семантические поля, тезаурусы, темы и подтемы

Некоторые словари, например, словарь Павла Литвинова [51], пытаются применить древесный принцип организации слов; темы, в рамках которых располагаются слова, разделены на несколько уровней. Однако никаких общих принципов такой классификации не предлагается.

С точки зрения современной лингвистики семантические поля представляют собой семантические классы слов, разбивающих весь вокабуляр на особые групп понятий, выражаемых словами.

Сегодняшняя наука предлагает следующее представление о семантических полях: все множество слов может члениться на отдельные поля, при этом различные поля пересекаются и не имеют четких границ. Целостность семантического поля определяется ассоциативными связями или неким соответствием с названием этого семантического поля. Еще одно свойство семантических полей есть то, что они представляют собой «большие массивы неупорядоченной лексики». Упорядочить их полностью до сих пор считалось вопросом будущего. Таким образом, в семантическом поле как нечетком множестве, во-первых, невозможно однозначно определить принадлежность слов к этому полю, во-вторых, трудно определить отношения порядка на нем как на множестве. В предлагаемой работе лексические пласты и далее отдельные единицы языка в этих пластах полностью упорядочиваются.

Следующая особенность семантических полей есть смысловое обобщение всех слов на основе категорий частей речи, идущее еще от Аристотеля. Это категории: предмет, признак, действие и т. п. По мнению современных исследователей, часть речи является лексико-семантической парадигмой высшего ранга, которая членит весь словарный состав языка на большие классы слов единиц языка, имеющих крайне абстрактное значение. Вероятно, следует считать части речи в принципе не семантическими. Они существуют параллельно с синтаксическими категориями, наряду с ними определяющими слова языка.

Нельзя не согласиться с тем, что при выделении семантических полей существует «опасность отождествления схожих, но не тождественных признаков», то есть отождествления общего и частного. Подобные суждения имеют свои истинные основания. Хотелось бы при этом не останавливаться в анализе лексики на слишком широком множестве понятий и не считать классы (предмет, признак предмета, действие, процесс или какое-либо иное множество слов) пределами обобщения. При этом современной наукой о языке не принято доказывать достаточность этих классов для классификации любых понятий.

В связи с этим некоторыми учеными высказывается мнение о необходимости «сближения толкового и идеографического словарей, чтобы сама позиция слова в статье тезауруса была семантически значимой, служила бы его семантическим признаком» [39]. Указанные принципы реализованы в предлагаемом словаре, что дает возможность порождать язык в системах семантически ориентированного взаимодействия с пользователем.

1.2.3. Задача представления иерархии языковых единиц

В личном письме Р. Г. Пиотровский определил сегодняшний путь науки к решению проблемы формализации семантики. Он указал на то, что якобы одному человеку не под силу формализация языка в целом, и следует заниматься заранее ограниченной «замкнутой» системой языка. Тем не менее, в предлагаемой работе именно отказ от ограничения классификации в рамках какой-либо узкой области привел к созданию системы, описывающей сходство и отличие понятий из самых разных областей знания.

Наиболее известными на сегодня иерархиями слов являются словари тезаурусы, активаторы. Их отличительными особенностями являются:

  1. Отсутствие деления узла иерархического дерева на достаточные для классификации любого понятия признаки.

  2. Отсутствие «симметрии» при классификации различных узлов этих деревьев, то есть общего признака для каждого отдельно взятого уровня классификации.

  3. Произвольность группировки слов по любым принципам: гиперонимии, ассоциативности и др.

  4. Чрезмерно длинные объяснения родовых отличий между классифицируемыми словами, без выделения одного главного и определяющего отличия.

Примерами таких классификаций являются: активаторы фирмы Лонгман, словарь Павла Литвинова, 3000 английских слов, техника запоминания.

Современные толковые словари имеют следующие недостатки:

  1. Отсутствие единообразных определений для схожих слов языка.

  2. Наличие «кругов» в определении слов, например, в словаре Harrap’s Dictionary слово «happy» определяется как «content», «content» как «satisfied», а «satisfied» как «joyful» и «happy».

Таким образом, актуальной является проблема построения максимально ясной, простой и единообразной иерархической структуры данных, в частности словарей, без чего системы анализа речи являются либо мало эффективными, либо ограниченными узкой предметной областью. При этом, необходимо перейти от концепции «очень сложной машины», при помощи скрытых от пользователя операций выдающей как правило «достаточно непредсказуемые» ответы на запросы пользователя, к концепции максимально простой и ясной структуры данных, где как пользователь, так и машина оперирует не отдельными словами, а целыми классами слов языка. Последнее должно гарантировать смысловое соответствие внутренней структуры данных, алгоритмов порождения и поиска, а так же представления о системе у пользователя.