Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Konspekt.rtf
Скачиваний:
282
Добавлен:
19.08.2013
Размер:
4.05 Mб
Скачать

14.2.5. Достоинства и недостатки объектно-ориентированной модели данных

К числу основных достоинств ОО модели данных можно отнести (слайд 14):

  • близость ОО концепции к восприятию мира, свойственному человеку (как следствие – более естественные процессы анализа и проектирования);

  • потенциально большее быстродействие (за счет использования ассоциативных связей);

  • отсутствие необходимости несколько искусственного деления системы на базу данных и программное обеспечение;

  • упрощение описания (предметной области, системы) за счет использования базовых механизмов ОО подхода.

Среди основных недостатков ОО модели данных можно выделить:

  • громоздкость описания ОО модели существующими языками (например, UML);

  • сложность перехода (смены парадигмы) к ОО модели от простой и распространенной реляционной модели данных;

  • ряд специфических проблем (например, идентификация объектов, формализация языков запросов, отсутствие математической основы ОО концепции).

14.3. Технологии интеграции распределенных данных на основе xml

Многие из проблем, с которыми связаны задачи интеграции информации, поддерживаемой средствами Internet, аналогичны проблемам создания систем неоднородных баз данных. К тому же при этом мы имеем дело с большим и не постоянным множеством Internet-источников, каждый из которых имеет большую степенью автономности и характеризуется разными метаданными.

Создание систем для решения любой из указанных выше задач требует, как и в случае классических баз данных, выбора методики для моделирования предметной области. Однако, кроме модели самих информационных объектов, необходимо также иметь модель самого Internet’а (как среды доступа), структуру Web-сайтов и Web-страниц (как ресурса).

Важной особенностью моделирования Internet-ресурса является и то, что во многих случаях данные слабо структурированы: нет схемы, которая была бы задана заранее, а данные из разных источников могут различаться как набором атрибутов, так и иметь различные типы. В этом случае система должна формировать схему на основе получаемых метаданных, возможно, в момент получения самих данных, а язык манипулирования данными в результате обработки запроса должен позволять генерировать сложные структуры.

Слабоструктурированными называются данные, обладающие определенной структурой, но эта структура может оказаться непостоянной или определенной не полностью. Коллекции таких документов иногда называют «не имеющими схемы», (schema-less) или самоопределенными (self-describing). Характерной особенностью слабоструктурированных данных является то, что описательная информация, которая обычно выделяется в отдельную схему, в той или иной форме присутствует в самих наборах данных. В некоторых формах представления слабоструктурированных данных не предусмотрено применение отдельной схемы, а в других она существует, но налагает на представленные в ней данные очень слабые ограничения.

В отличие от этого, для реляционных СУБД требуется заранее определенная схема, позволяющая распределить данные по таблицам, а все данные, управляемые этой системой, должны соответствовать такой структуре. Объектно-ориентированные СУБД допускают создание более гибкой структуры по сравнению с реляционными СУБД, но также требуют, чтобы все данные укладывались в заранее заданную схему.

Схема слабоструктурированных данных может быть как предписывающей, так и описывающей.

Примером предписывающей схемы слабоструктурированных данных является Document Type Definition (DTD) или XML-схемы, которые описывают структуру XML-документов, а XML-процессоры используют это описание при разборе. Если разбираемый документ не соответствует DTD, процессор прекращает его разбор и сигнализирует об ошибке. Таким образом, предписывающая схема накладывает ограничения на структуру данных.

При рассмотрении модели слабоструктурированных данных обычно выделяют две основные проблемы: во-первых, структура данных обычно известна лишь частично, во-вторых, она является глубоко вложенной или даже циклической, что требует от системы управления базами данных развитых рекурсивных возможностей. Реляционная алгебра этому требованию не соответствует

Соответственно, большинство подходов к управлению слабоструктурированными данными основано на использовании языков запросов, обеспечивающих прохождение по древовидному размеченному графу, который служит для идентификации данных путем указания позиции элемента данных в коллекции, а не формализации его структурных свойств. Это означает, что способы выполнения запросов к данным теряют свой традиционный декларативный характер и становятся в большей степени навигационными.

Соседние файлы в предмете Базы данных