Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1 Возникновение эргономики.docx
Скачиваний:
2
Добавлен:
06.08.2019
Размер:
104.15 Кб
Скачать

18. Глоссарий проекта. Метаданные.

В обработке данных метаданные представляют собой описательные данные, содержащие сведения или документацию о других данных, с которыми осуществляются действия в приложении или среде. Метаданные могут содержать описательную информацию о контексте, качестве и состоянии, либо характеристики данных.

Теги метаданных применяются для описания документов, страниц, графики, программ, звуковых и видеофайлов и других объектов содержимого для того, чтобы облегчить переходы по ссылкам и извлечение информации.

Простой пример дает тег HTML <meta>, используемый многими веб-сайтами. Авторы могут свободно вводить слова и фразы, описывающие содержимо Эти ключевые слова не отображаются в интерфейсе, но доступны для поисковых механизмов.

Многие компании используют метаданные более изощренными способами. Применяя программы управления содержимым и управляемые словари, они создают динамические веб-сайты, управляемые метаданными, которые поддерживаю! распределенное создание содержимого и мощную навигацию. Эт: модель управляющих метаданных представляет собой глубокое изменение в технологии создания и управления веб-сайтами. Вместо вопроса «как классифицировать этот документ» мы теперь можем спросить «как описать этот документ». Программное обеспечение и словари возьмут на себя все остальное.

Ярким примером такого использования метаданных может служить ресурс Википедия. Использование

Метаданные используются для повышения качества поиска. Поисковые запросы, использующие метаданные могут спасти пользователя от лишней ручной работы по фильтрации. Управляемые словари

Управление словарями принимает различные формы. Одно из пределений состоит в том, что управляемый словарь - это любое заданное подмножеств! естественного языка. В простейшем случае управляемый словарь представляет собой список эквивалентных терминов в виде колец синонимов (synonym rings), или список предпочтительных терминов в виде нормативного файла (authority file). В порядке "от простого к сложному" можно разбить понятие управляемых словарей: -Кольца синонимов. -Нормативные файлы.

-Схемы классификации. *

-Тезаурусы.

Кольцо синонимов соединяет группу слов, которые определены как эквивалентные для задач извлечения информации. На практике эти слова не всегда являются подлинными синонимами. Если не пользоваться кольцами синонимов снижается результативность работы поисковиков.

Нормативные файлы - это список предпочтительных терминов или приемлемых значений. В него не входят альтернативы или синонимы. Нормативны файлы традиционно применялись в библиотеках и правительственных учреждениях, чтобы определять правильные названия для группы сущностей внутри некоторой ограниченной области.

Схемы классификации. Под схемой классификации мы понимаем иерархическую организацию предпочтительных терминов. В настоящее время многи предпочитают слово «таксономия». В любом случае важно понимать, что эти иерархии могут принимать различную форму и служить разным целям, в число которых входят:

Иерархия на стороне клиента, типа Yahoo, допускающая навигацию и являющаяся видимой составной частью пользовательского интерфейса. Инструмент на сервере, применяемый информационными архитекторами, авторами содержимого и создателями указателей для организации документов и разметки их с помощью тегов.

Тезаурусы. Тезаурус в современной лингвистике — особая разновидность словарей общей или специальной лексики, в которых указаны семантические отношения (синонимы, антонимы, паронимы, гипонимы, гиперонимы и т . п.) между лексическими единицами. Таким образом, тезаурусы, особенно в электронном формате, являются одним из действенных инструментов для описания отдельных предметных областей.

В отличие от толкового словаря, тезаурус позволяет выявит ь смысл не только с помощью определения, но и посредством соотнесения слова с другими понятиями и их группами, благодаря чему может использоваться в системах искусственного интеллекта.

Поисковый тезаурус русского языка представляет словарь общей лексики с семантическими отношениями между словами. Использование тезауруса в информационно-поисковых системах призвано повысить полноту поиска информации, позволяя расширять запрос синонимичными, более общими и более частными понятиями.