Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ответы на вопросы по информатике.docx
Скачиваний:
2
Добавлен:
20.09.2019
Размер:
131.72 Кб
Скачать

19)Глоссарий проекта.

Метаданные. В обработке данных метаданные представляют собой описательные данные, содержащие сведения или документацию о других данных, с которыми осуществляются действия в приложении или среде. Например, в метаданных могут регистрироваться данные об элементах данных или атрибутах (таких как имя, размер, тип данных и т. д.), данные о записях или структурах данных (длина, поля, колонки и т. д.) и данные о данных (где они находятся, как связаны, кто владелец и т. д.). Метаданные могут содержать описательную информацию о контексте, качестве и состоянии, либо характеристики данных. Эти тавтологичные объяснения могут увести нас в дебри гносеологии и метафизики, но мы туда не пойдем. Теги метаданных применяются для описания документов, страниц, графики, программ, звуковых и видеофайлов и других объектов содержимого для того, чтобы облегчить переходы по ссылкам и извлечение информации. Простой пример дает тег НТМЪ <meta>, используемый многими веб-сайтами. Авторы могут свободно вводить слова и фразы. описывающие содержимое. Эти ключевые слова не отображаются в интерфейсе, но доступны для поисковых механизмов. Многие компании используют метаданные более изощренными способами. Применяя программы управления содержимым и управляемые словари, они создают динамические веб-сайты, управляемые метаданными, которые поддерживают распределенное создание содержимого и мощную навигацию. Эта модель управляющих метаданных представляет собой глубокое изменение в технологии создания и управления веб-сайтами. Вместо вопроса «как классифицировать этот документ» мы теперь можем спросить «как описать этот документ». Программное обеспечение и словари возьмут на себя все остальное. Ярким примером такого использования метаданных может служить ресурс http://ru.wikipedia.org

Использование Метаданные используются для повышения качества поиска. Поисковые запросы, использующие метаданные могут спасти пользователя от лишней ручной работы по фильтрации. Информируя компьютер о том, какие элементы данных связаны и как эти связи учитывать, становится возможным осуществлять достаточно сложные операции по фильтрации и поиску. Например, если поисковая система «знает» о том, что «Ван Гог» является «голландским художником», то она может выдать в ответ на запрос о голландских художниках веб-страницу о Ван Гоге, даже если слова «голландский художник» не встречаются на этой странице. Такой подход, называемый представлением знаний, находится в сфере интересов Семантической паутины и искусственного интеллекта. Управляемые словари Управление словарями принимает различные формы. Одно из пределений состоит в том, что управляемый словарь - это любое заданное подмножество естественного языка. В простейшем случае управляемый словарь представляет собой список эквивалентных терминов в виде колец синонимов (synonym rings), или список предпочтительных терминов в виде нормативного файла (authority file). Определите иерархические отношения между терминами (например, «шире», «уже»), и получится схема классификации. Смоделируйте ассоциативные связи между понятиями (например, «см. также», «см. близкое»), и получится тезаурус. В порядке "от простого к сложному" можно разбить понятие управляемых словарей:

-Кольца синонимов.

-Нормативные файлы.

-Схемы классификации.

-Тезаурусы.

Кольцо синонимов соединяет группу слов, которые определены как эквивалентные для задач извлечения информации. На практике эти слова не всегда являются подлинными синонимами. Представьте себе, например, что проектируете заново портал потребителей, предоставляющий информацию о рейтингах бытовой техники, производимой разными компаниями.

Нормативные файлы Строго говоря, нормативный файл (authority file) - это список предпочтительных терминов или приемлемых значений. В него не входят альтернативы или синонимы. Нормативные файлы традиционно применялись в библиотеках и правительственных учреждениях, чтобы определять правильные названия для группы сущностей внутри некоторой ограниченной области. Схемы классификации Под схемой классификации мы понимаем иерархическую организацию предпочтительных терминов. В настоящее время многие предпочитают слово «таксономия». В любом случае важно понимать, что эти иерархии могут принимать различную форму и служить разным целям, в число которых входят:

-Иерархия на стороне клиента, типа Yahoo, допускающая навигацию и являющаяся видимой составной частью пользовательского интерфейса.

-Инструмент на сервере, применяемый информационными архитекторами, авторами содержимого и создателями указателей для организации документов и разметки их с помощью тегов.

Тезаурусы. Теза́урус (от греч. сокровище) в современной лингвистике — особая разновидность словарей общей или специальной лексики, в которых указаны семантические отношения (синонимы, антонимы, паронимы, гипонимы, гиперонимы и т . п.) между лексическими единицами. Таким образом, тезаурусы, особенно в электронном формате, являются одним из действенных инструментов для описания отдельных предметных областей. В отличие от толкового словаря, тезаурус позволяет выявить смысл не только с помощью определения, но и посредством соотнесения слова с другими понятиями и их группами, благодаря чему может использоваться в системах искусственного интеллекта. В прошлом термином тезаурус обозначались по преимуществу словари, с максимальной полнотой представлявшие лексику языка с примерами её употребления в текстах.