Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Разработка и стандартизация ПС и ИТ.doc
Скачиваний:
329
Добавлен:
10.05.2014
Размер:
3.62 Mб
Скачать

50. Онтология как средство формализованного представления информации.

Онтология – это набор определений (на формальном языке) фрагмента декларативных знаний, ориентированный на совместное многократное использование различными пользователями. В онтологии вводятся термины, типы и соотношения (аксиомы), описывающие фрагмент знания. Таким образом, онтология определяет общий словарь для специалистов, которым нужно совместно использовать информацию в предметной области.

Понятие онтология активно применяется в информатике и искусственном интеллекте. Этот термин пришел из философии, где обозначал часть метафизики - учение обо всем сущем, о его наиболее общих философских категориях, таких как бытие, субстанция, причина, действие, явление. При этом онтология как наука претендовала на полное объяснение причин всех явлений.

Онтологии позволяют представить понятия в виде, пригодном для машинной обработки. Нередко онтологии используются в качестве посредника между пользователем и информационной системой: они позволяют формализовать договоренности о терминологии.

По степени зависимости от конкретной задачи или предметной области обычно различают следующие онтологии.

Онтологии верхнего уровня. Такие онтологии описывают наиболее общие, независимые от конкретной проблемы или области, концепты (пространство, время, материя, объект, событие, действие и т. д.) которые могут быть унифицированы для больших сообществ пользователей.

Онтологии, ориентированные на предметную область. Во многих дисциплинах в настоящее время разрабатываются стандартные онтологии, которые могут использоваться экспертами для совместной информационной деятельности в своей области.

Онтологии, ориентированные на задачу. Это онтологии, используемые при выполнении конкретной задачи. Они отражают специфику решения задачи, но могут также содержать некоторые общие термины.

Прикладные онтологии. Такие онтологии описывают понятия, которые могут относиться как к онтологии задач, так и к онтологии ПрО. Примером может служить онтология автомобилей, строительных материалов, вычислительной техники. Прикладная онтология обобщает понятия, использующиеся в некоторых задачах ПрО, абстрагируясь от самих задач (так, онтология автомобилей независима от любых особенностей конкретных марок машин).

Язык описания онтологий

Ключевым моментом в проектировании онтологии является выбор языка спецификации онтологий (Ontology specification language). Цель таких языков - существенно повысить выразительные возможности концептуального моделирования слабо структурированных данных.

К традиционным языкам спецификации онтологий относятся: Ontolingua; CycL; языки, основанные на дескриптивных логиках (LOOM [58]); языки, основанные на фреймах (OKBC, OCML, Flogic [19]).

Более поздние языки ориентированы на Web-стандарты (XOL, SHOE, UPML). Специально для обмена онтологиями через Web были созданы RDF(S), DAML, OIL, OWL.

51. Методы выделения информативных терминов.

Первой задачей при построении терминологической системы является задача выделения из текстов предметной области отдельных слов или словосочетаний, которые могут служить для данной предметной области ключевыми понятиями. Для выявления терминов – кандидатов для включения в терминологическую систему применяются модели «взвешивания» и ранжирования терминов. Вычисление веса отдельного термина в рамках информационного массива проводится в соответствии со следующими основными методиками:

TF (Term Frequency) – в основе методики лежит частота встречаемости термина в документе (или в массиве документов).

TF*IDF (Term Frequency*Inverse Document Frequency) – в соответствии с этой методикой вес слова зависит от частоты его появления в конкретном предложении и в документе в целом.

TL*TF (Term Length*Term Frequency) - методика базируется на том, что слова, которые появляются часто, стремятся быть краткими. Такие слова не описывают основную тему документа, т.е. являются стоп словами. Наоборот, слова, которые появляются редко, стремятся быть длинными.