Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Макро шпоры отредакт верон БГЭУ 2 курс 2016.doc
Скачиваний:
30
Добавлен:
26.03.2017
Размер:
839.68 Кб
Скачать

1.1. Экономическая информация, ее виды, структурные единицы. Информация - любые сведения о каком-л событии, сущности, процессе независимо от формы ее представления.

Эконом-кая информация (ЭИ) – информация, возникающая при подготовке и в процессе производственно-хозяйственной деятельности человека.

Основные особенности ЭИ: 1)специфичность по форме представления, 2)объемность, 3)цикличность, 4)наличие натуральных и стоимостных измерителей, 5)специфичность по способу обработки, 6)длительность хранения.

Требования к ЭИ: корректность, целостность, оперативность, точность, актуальность, полнота.

Виды ЭИ: 1)по функциям управления: учетная, плановая, директивная, статистическая; 2)по месту возникновения: внутренняя (полученная внутри экономического объекта), внешняя (поступающая из вышестоящих звеньев управления); 3) по стадиям образования: первичная (возникает из начальной стадии управления), вторичная (возникает в результате обработки первичной); 4) по источнику поступления: входная (поступает в фирму извне и используется как первичная информация), выходная (поступает из одной системы в другую); 5)по степени структурированности: неструктурированная, слабо структурированная, структурированная, формализовано структурированная, машинно-структурированная. Составная единица информации (СЕИ) – это ед. инфы, состоящая из совокупности других ед. инфы, связанных между собой некоторыми отношениями. К структурным ед. ЭИ относят: 1) реквизит- это логически неделимый элемент любой сложной информационной совокупности, соотносимый с определенным свойством объекта: реквизит-признак (характеризует качественное свойство объекта: фам, год рожд), реквизит-основание (количественная характеристика в определенных единицах: объем товара); 2) показатель = реквизит-признак + реквизит-основание; 3) документ – представляет собой сумму показателей; 4) массивы - совокупность документов, объединенных по какому либо признаку.

1.2. Внемашинная организация экономической информации: документы, их виды, структура. Инфа делится на внутримашинную (фиксируется на машинных носителях и воспринимается человеком только посредством технических средств) и внемашинную (часть ЭИ, которая может быть представлена и воспринята пользователем без использования технических средств). Закон РБ «Об инфе, информатизации и защите инфы» от 10.11.08 №455-3. Формой представления внемашинной инфы является документ. Документ -инфа, зафиксированная на материальном носителе с реквизитами, позволяющими ее идентифицировать. Реквизит – совокупность формальных элементов, отсутствие кот лишает документ юридической силы. В структуру документа включают: 1) заголовочная часть (обязательные и необязательные реквизиты-признаки); 2) содержательная; 3) оформляющая - подписи, дата составления. Массив – совокупность документов, объединенных по определенному признаку. Документы классифицируются: 1) по сфере деятельности (плановые, учетные, статистические, банковские, финансовые); 2)по отношению к объекту управления (входящие, исходящие, промежуточные, архивные); 3) По содержанию хозяйственных операций (материальные, денежные, расчетные); 4) по назначению (распорядительные, исполнительные, комбинированные); 5) по способу заполнения (заполняемые с помощью технических средств и вручную); 6) по отношению к машинной обработке ЭИ ( первичные и сводные, получаемые в результате машинной обработки первичных документов).

1.3. Понятие классификации информации. Системы классификации. Система классификации - совокупность правил распределения элементов заданного множества на подмножества в соответствии с установленными признаками сходства или различия, называ-ми основанием. При классификации должны соблюдаться требования: 1) полнота охвата объектов рассматриваемой области; 2)однозначность реквизитов; 3) возможность включения новых объектов. Разработано 3 метода классификации: иерархический, фасетный, дескрипторный. Иерархическая система классификации предполагает деление объектов на некоторые группы, каждая из которых, в свою очередь, делится на более мелкие подгруппы, постепенно конкретизируя объект классификации. Ее преимуществом является традиционность и приспособленность для внемашинной обработки информации. Недостаток: сложность при внесении изменений и негибкость структуры. Фасетная система классификации позволяет выбирать признаки классификации независимо друг от друга и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами. Каждый фасет содержит совокупность однородных значений данного классифицируемого признака. Значения в фасете могут располагаться в произвольном порядке, но предпочтительнее их упорядочение.

Ф1 Ф2 Ф3 …

Дескрипторная система классификации используется для: 1) организации поиска информации; 2) введения тезаурусов (словарей). Ее язык приближается к естественному языку описания инф. объектов. Суть дескрипторного метода классификации: 1) отбирается совокупность ключевых слов и словосочетаний; 2) из совокупности синонимов выбирается один или несколько наиболее употребляемых; 3) создается словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

Классификаторы информации, их назначение, виды. Виды информации: внемашинная инфа – часть ЭИ, которая представлена и м.б. воспринята пользователем без использования технических средств; внутримашинная инфа – фиксируемая на машинных носителях и воспринимаемая человеком только посредством технических средств; документированная инфа – инфа, зафиксированная на носителе с реквизитами, позволяющими её идентифицировать.

Систематизация ЭИ вызывает необходимость применение классификаторов: общегосударственных (разрабатываемых в централизованном порядке); отраслевых (единых для определённых отраслей); локальных (характерных для данных предприятия). Классификатор – систематизированный свод однородных наименований и их кодовых значений. Применяются для разного рода представления кодов в документах и для размещения в памяти машины в качестве словарного фонда.

Назначение: 1) систематизация наименований кодируемых объектов; 2) однозначная интерпретация одних и тех же объектов в различных задачах; 3) возможность обобщения инфы по заданной совокупности признаков; 4) возможность сопоставления одних и тех же показателей, содержащихся в формах статистической отчетности; 5) возможность поиска и обмена инфой между различными внутрифирменными подразделениями и внешними информационными системами; 6) экономия памяти компьютера при размещении кодируемой информации.

1.4. Понятие кодирования информации, методы кодирования

Для записи инфы на носители и её обработки используется кодирование информации, т. е. перевод сообщений с исходного языка на формализованный с помощью кодов. В процессе кодирования объектам классификации присваиваются цифровые, буквенные или буквенно-цифровые кодовые обозначения. Кодирование облегчает ввод и обработку данных, а также увеличивает плотность записи инфы на носителях.

Виды кодов: 1) по методу образования: порядковые (при которых объектам присваиваются порядковые номера), серийно-порядковые (выделяется серия, а внутри серии присваиваются порядковые номера), разрядные (при которых каждому признаку классификации отводится определённое число разрядов), комбинированные; 2) по количеству разрядов: замкнутые системы кодирования (при которых строго ограничено кол-во символов), открытые (с неограниченным количеством символов); 3) по форме отображения: цифровая форма кодирования; буквенная; буквенно-цифровая; 4) позиционная форма кодирования (позиция числа имеет значение); 5) штриховое кодирование.

1.5. Внутримашинная организация экономической информации: файловая организация данных и базы данных. Преимущества баз данных. В 50-х, начале 60-х годов использовалась файловая организация данных. Данные хранились в файлах последовательного доступа. Это заставляло прикладную программу обрабатывать файл целиком, когда необходимо было обратиться к определенной записи, что существенно замедляло скорость обработки данных. Основные операции с файлами в СУФ: создать, открыть ранее созданный файл, прочитать из файла определенную запись, добавить запись в конец файла. Недостатки файловой организации данных: 1) избыточность, 2) статичность, 3) противоречивость, 4) зависимость данных, 5) ограничение разделения данных, 6) ограниченность доступности данных, 7) отсутствие интеграции. Эти недостатки файловой организации данных обусловили появление баз данных (БД), которые позволяют обеспечивать более эффективный доступ к данным и их обработку. БД – поименованная и структурированная совокупность взаимосвязанных данных, которая отражает состояние объектов конкретной предметной области, их свойства и взаимоотношения и находящихся под общим программным управлением. Преимущества использования БД: 1) возможность и простота расширения и модификации данных. 2) обеспечение независимости данных в БД от программ их обрабатывающих. 3) быстрый поиск необходимых данных по запросам пользователя. 4) обеспечение защиты секретных данных от постороннего вмешательства. 5) обеспечение целостности данных и др. Банк данных – организационно-техническая система, вкл-ющая одну или несколько БД и систему управления ими. Основной принцип организации БД: совместное хранение данных и их описаний – метаданных. Он обеспечивает независимость данных, что позволяет обрабатывать их без написан дополнит программ. Классификация БД по масштабу: 1) уровень предприятия, 2) подраздел, 3) научной группы, 4) интегрирование БД нескольких подраздел. Классификация по технологии хранен: 1) во вторичной памяти, 2) в оперативной памяти, 3) в третичной памяти.

1.6. Сверхбольшие БД. Сверхбольшая база данных — это база данных, которая занимает чрезвычайно большой объём на устройстве физического хранения. Для сравнения, в 2005 г. самыми крупными в мире считались базы данных с объёмом хранилища порядка 100 терабайт. Специалисты отмечают необходимость особых подходов к проектированию сверхбольших БД. Для их создания нередко выполняются специальные проекты с целью поиска таких системотехнических решений, которые позволили бы хоть как-то работать с такими большими объёмами данных. Как правило, необходимы специальные решения для дисковой подсистемы, специальные версии операционной среды и специальные механизмы обращения СУБД к данным.

2.7.Понятие модели данных. Иерархическая модель, ее достоинства и недостатки. Модель данных (Котон в 1970г.) некая абстракция, кот будучи приложена к конкретным данным, позволяет пользователям трактовать их как инф-ю, т.е. сведения, содержащие не только данные, но и взаимосвязи между ними. Модели данных определяют: 1) структуры организации хранения БД; 2) ограничения целостности; 3) набор выполняемых операций. Модель данных для СУБД – совокупность правил порождения структуры данных в БД, операций над ними, а также ограничений целостности, определяющую допустимые связи и значения данных, последовательности их изменения. Структура данных – множество элементов данных и множество связей между ними. Физическая структура - отражает способ физического представления данных в памяти компьютера (и еще называется структурой хранения, внутренней структурой или структурой памяти). Логическая структура (абстрактная) - структура данных без учета ее представления в машинной памяти. Существует 3 типа логических моделей: - иерархическая (60-е гг.);- сетевая (60-е гг.);- реляционная (70-е гг.). Они отличаются способами представления связей между объектами. Иерархичическая строится по принципу иерархии объектов. 1 объект –главный, другие - подчиненные. Между главным и подчиненными объектами устанавливается связь «1:М»: для каждого экземпляра главного объекта. соответствует несколько подчиненных. Узлы (совокупность атрибутов, описывающих объект) и ветви образуют древовидную структуру, которая предполагает несколько уровней подчинения.. Иерархическая модель применяется для организаций различного профиля: военных, администраторов и т.д. Представление модели в памяти компа осущ-тся с помощью файловых записей переменной длины, или с помощью перечисления записей каждого дерева в порядке «сверху-вниз». Операции манипулирования данными: - найти указанное дерево; - перейти от одного дерева к другому; - перейти от одной записи к другой внутри дерева; - перейти от одной записи к другой в порядке обхода иерархии; - вставить новую запись; -удалить текущую запись. +: эффективное использование оперативной памяти и неплохие временные показатели выполнения операций; - удобна для раб-ты с иерархически. организованными дан-ми; - простота. – : сложность логических связей; - громоздкость при обработке. Примеры: отечеств: Ока, ИНЕС, МИРИС; IMS фирмы IBM, HC/Focus, Data-Edge.

2.9. Сетевая модель, ее достоинства и недостатки.Расширены понятия главного и подчиненного объекта. Любой объект может быть главным и подчиненным. Главный-владелец набора, подчиненный - член набора. Используется в сетевых коммуникациях передачи данных. Один и тот же объект может участвовать в любом числе взаимосвязей (пример-библиотека). Манипулирование данными: - найти конкретную запись в наборе; - перейти к следующему потомку по некоторой связи; -перейти от потомка к предку по некоторой связи; - создать новую запись;-уничтожить запись; - исключить из связи; - переставить в другую связь. + :-высокая эффективность при размещении данных в памяти; - оперативность. – :-сложность и жесткость схемы базы; - сложность понимания; -сложность контроля целостности.

2.10. Реляционная модель. Ее базовые понятия (отношение, домен, кортеж, схема, степень и мощность отношения), достоинства и недостатки.Объекты и взаимосвязи представляются в виде таблиц. Взаимосвязи рассматриваются в качестве объектов. Каждая таблица представляет объект. Таблица должна иметь первичный ключ (поле или комбинацию полей, коте единственным образом идентифицирует каждую строку в таблице). Эта модель получила наибольшее распространение в СУБД для персонального компа. Отношен – таблица; Столбец – атрибут; строка – кортеж. Схема отношения – это именованное множество пар (имя атрибута, имя домена). Сов-ть схем от-ний, использ-мых для представления инфы наз-ся схемой реляц БД, а текущие значения соответствующих отношений - реляц БД. В реляционной алгебре поименованный столбец отношения называется атрибутом, а множество всех возможных значений конкретного атрибута – доменом.

Отн-ния обладают св-ми:- не содержат картежей дубликатов; -атрибуты не упорядоч-ны; картежи неупоряд-ны; -знач всех атриб-ов атомарны; - послед-ть картежей и атрибутов не существенна; все картежи орган-ны по 1-й стр-ре.

+: - простота схемы данных для польз-ля;- повышение лог и физ нез-сти; - предоставление польз-лю языков выс ур-ня;-оптимизация доступа к БД; - улучшение целостности и защ дан.; - возмож-ть раз-х применений; - строг мат основа

-: -все дан хран-ся в виде отно-й, состоящих из простых атрибутов; - для описания их провед-ния треб-ся создать прикл. Программы; - БД состоит из большего кол-ва таблиц, что затрудняет процесс выборки и хран-ся много лишней инф; - возможностей недостаточно, когда объекты данных сложны.

Сущ-ет 2 мех-ма манип-ния данными: 1.реляц алгебра2. мат логика. Степень отн-ния- число атрибутов, Кардинальное число или мощность отношений - число его картежей.

2.11.Постреляционная модель, ее достоинства и недост-ки. 1)Поддерживает множественные группы, называемые ассоциированными множественными полями, а сов-ть объединенных множественных полей наз ассоциацией. 2) Не накладываются огранич на длину и кол-во полей в записях, что делает структуру табл более наглядной. Постреляц модель данных реализована в СУБД uniVers, Bubba, Dasdb и др.

Дост: возможность представления сов-ти связ реляц табл в виде одной постреляц таблиц.

Нед-ки: сложность обеспечения целостности и непротиворечивости данных

2.12. Объектно-ориентированная модель данных. Ее базовые понятия, достоинства и недостатки. Объекты инкапсулируют данные и методы, т.е. доступ к значениям данных возможен только через методы. Внутр структура объекта скрыта от пользователя. Изменение состояния объекта, манипуляция с ним возможны только через его методы.

В наиб общей и класс. постановке об-ориен подход базируется на понятиях: 1 Объект и индентификатор объекта, 2) Атрибут и метод, 3) Класс, 4) Иерархия и наследование классов.

Метод – программный код, привязанный к определенному классу и применяемый к объектам этого класса. Класс – абстракция, определяющая множество объектов одной структуры. Каждый объект явл экземпляром некот класса. Между классами устанавливаются отношения наследования. Состояние объекта определяется набором значений множества свойств. Этими свойствами могут быть атрибуты объекта и связь между объектом и одним или неск-ими другими объектами. Поведение объекта определяется набором операций, которые могут быть выполнены над данными объекта или самим объектом. БД хранит объекты, позволяя совместно использовать их различным пользователям и приложениям. Структура ООБД графически представима в виде дерева, узлами которого явл объекты. ООБД: POET, Jasmine, Orion, Iris.

Осн-ным достоинством явл возможность отображения инфор-ии о сложных взаимосвязанных объектах. Об-ориентир модель позволяет также идентифицировать отдельные записи в базе и определять функции их обработки. Осн-ой недостаток сост в сложности понимания ее сути и низкой скорости выполнения запросов.

2.13.Многомерная модель данных, ее баз понятия, достоин-ва и недост. Многомерные модели: 1)информация предст-ется в виде многомерных массивов-гиперкубах. 2) в одной БД, построенной на многомерной модели, может храниться множ-во кубов разной размерности, на основе кот можно проводить совместный анализ показателей (поликубическая). 3) конечный пользователь получает для анализа определен срезы (проекции кубов), представлен в виде обычных двумерных табл или графиков. Измерение – множество однотипных данных, образующих одну из границ гиперкуба. Наиболее часто использ-ые в анализе измерения: 1) временные: день, месяц, год, 2) географич: город, район, регион. Ячейка – часть данных, кот определ-ся путем определ-ия одногого элемента в каждом измерении многомерного массива. Ячейки гиперкуба могут быть пусты или полны. Когда значите-ое число ячеек куба не содержит данных – разреженный куб. Для многомер модели применяются след операции: срез – подмножество гиперкуба, полученное путем фиксации одного или нескольких измерений; вращение - изменение порядка измерений при визуализации данных; агрегация – более общее представление данных; детализация – более детальное представление данных. Достоинства: удобство; эффективность анализа больших объемов данных, имеющих временную связь; быстрота реализации сложных нерегламентированных запросов. Недостаток – громоздкость.

Многомерн модели поддерживают: Essbare, Media Multi-matrix, Orade Express Server, Cache. Некоторые системы поддерживают одновременно реляционные и многомерные модели, например, Media MR.

3.14. Понятие проект-ния БД. Треб-ния, предъявляемые к БД. (БД) - именованная совокуп-сть данных, отображ-щая сост-ие объектов, их свойства и взаимоотношения в некот предметной области. Проектирование БД – процесс создания проекта БД, предназнач-ной ля поддержки функц-ования эконом-кого объекта и способ-щей достижению его целей. Оно представляет собой трудоемкий процесс, требующий совместных усилий аналитиков, проектировщиков и пользователей. БД представляет собой новый подход к организации данных. Она позволяет обращение к данным без знания физического расположения их в памяти компьютера, вследствие чего доступ к данным и их обработка более эффективны. Разработка прикладных программ, использующих БД, становится легче, быстрее, дешевле, более гибкой. В этом главные преимущества БД над файловой организацией данных. При проектировании базы данных необходимо учитывать тот факт, что база данных должна удовлетворять комплексу требований. След.требования: 1) целостность БД – требование полноты и непротиворечивости данных; 2) многократное использование данных; 3) быстрый поиск и получение информации по запросам пользователей; 4) простота обновления данных; 5) уменьшение излишней избыточности данных; 6) защита данных от несанкционированного доступа, искажения и уничтожения.

3.15 Модель "сущность-связь", ее понятия: сущность, атрибут, экземпляр сущности, связь, мощность связи. Представление сущности и связи на ER-диаграмме. Средством моделирования предметной области на этапе концептуального проектирования является модель "сущность–связь". Часто ее называют ER-моделью (Entity – сущность, Relation – связь). В ней моделир-ие структуры данных предметной области базир. на испол-ии графических средств – ER-диаграмм. В наглядном виде они представляют связи между сущностями. Сущность – любой различимый объект(кот. Мы можем отличить от другого), информ-ию о кот.необходимо хранить в БД.. Сущность имеет экземпляры, отлич-ся друг от друга значениями атрибутов и допуск-ие однозначную идентификацию. Атрибут–это характеристика сущности,имеет имя для конкретн.вида сущ-ти, может быть одинков. Для разл.типов сущ-ти. Например, сущность КНИГА характеризуется такими атрибутами, как автор, наименование, цена, издательство, тираж, количество страниц. Экземпляр-конкретный представитель данной сущ-ти.(Конкрет. Названия книг, Сотрудник Иванов. Они отличаются значениями указанных атрибутов и однозначно идентифицируются атрибутом "наименование". Атрибут, который уникальным образом идентифицирует экземпляры сущности, называется ключом. Может быть составной ключ, представляющий комбинацию нескольких атрибутов. На ER-диаграмме сущность изображается прямоугольником, в котором указывается ее имя. В реальном мире существуют связи между сущностями. Связь – некая ассоциация между сущн-ями, характеризуется мощностью, которая показывает, сколько сущностей участвует в связи. Сущн-ть м.б. связаня с др.сущ-ми или сама с собой.Связь между двумя сущностями называется бинарной, а связь между более чем с двумя сущностями – тренарной. На ER-диаграмме связь изображается линией,соед. 2 сущ-ти. При разраб-ке ЕR-моделей мы должны учесть след.инф. о предм. обл.:1)список сущ-ей.предм.обл.2)список атриб-в сущ-ти. 3)описание взаимосвязей между сущ-ми. В ЕR-диаграмме кажд.сущ-ть должна иметь наименование, выражен. существит. в И.п. единст.числе.

3.16. Правила преобраз-ния ER-диаграмм в реляц-ые табл-цы случае связей 1:1. Правило1: Если связь типа 1:1 и класс принадлежности обеих сущностей явл-ся обязательным, то необходима только одна таблица. Первичным ключом этой таблицы может быть первичный ключ любой из 2-х сущностей. Правило2: Если связь типа 1:1 и класс принадл-ти одной сущности явл-ся обязат, а др.-необязат., то необходимо построить табл-ц для каждой сущности.

Первичный ключ сущности д.б.первичным ключом соответствующей таблицы.Первичный ключ сущности,для кот.класс принадл-ти явл-ся необязат.добавляется как атрибут в таблицу по сущности с обязат.классом принадл-ти. Правило3: Если связь типа 1:1 и класс принадл-ти обеих сущностей необязат.,то необходимо построить 3 таблицы-по одной для каждой сущ-ти и одну для связи. Первичный ключ сущ-ти д.б. первич.ключом соответствующей таблицы.Т-ца для связи должна иметь 2 атрибута-внешние ключи обеих сущ-ей.

Правила преобразования ER-диаграмм в реляционные таблицы в случае связей 1:М, М:N. Правило4: Если связь типа 1:М и класс принадл-ти сущ-ти на стороне М явл-ся обязат., то необходимо построить таб-цу для каждой сущ-ти. Первичный ключ сущ-ти д.б.первичным ключом соответст.таб-цы.Первичный ключ сущ-ти на стороне 1 добавл.как атрибут в таб-цу для сущ-ти на стороне М. Правило5: Если связь типа 1:М и класс принадл-ти сущ-ти на стороне М явл-ся необязат.,то необходимо построить 3 таб-цы- по одной для каждой сущ-ти и одной для связи. Первичный ключ сущ-ти д.б.первичным ключом соответс.таб-цы.Таб-ца для связи д.иметь 2 атрибута-внешние ключи обеих сущ-ей. Правило6: Если связь типа М:N, то необходимо построить 3 таб-цы-по одной для каждой сущ-ти и одну для связи.Первичный ключ сущ-ти д.б.первичным ключом соответствующей таб-цы. Таблица для связи д.иметь 2 атрибута-ключи обеих сущ-ей.При этом осущ-ся декомпозиция связи М:N на две связи 1:М.

3.17.нормализация таблиц,ее цель.1я нормальная форма, 2НФ, 3НФ Реляц.БД явл-ся эфф-ной, если обладает след. хар-ками: 1.минимизация избыточности данных; 2.min-ое. использ-е отсутств-щих значений(null-значений); 3. предотвращение потери информации. Нормализация таблиц позволяет минимизировать избыточность данных. Методику нормализации таблиц разработал А.Ф.Кодд. Её суть сводится к приведению таблиц к той или иной нормальн.форме. Были выделены 3 нормальн формы: 1НФ, 2НФ, 3НФ. Позже стали выделять нормальн форму Бойса-Кодда(НФБК), затем 4НФ И 5НФ. Каждая последующая нормальн форма вводит определенные ограничения на хранимые в базе данные. Реляц БД считается эфф-ной, если все ее таблицы наход-ся как минимум в 3НФ. Таблица наход-ся в 1НФ, если все ее поля содержат только простые неделимые значения.

Табл наход-ся во 2НФ , если она удовл-т требованиям 1НФ и неключевые поля функционально полно зависят от первичн ключа. Для приведения отношения ко 2НФ необходимо: - построить его проекцию, исключив атрибуты, которые не находятся в функционально-полной зависимости от составного ключа; - построить дополнительную проекцию на части составного ключа и атрибута, функционально зависящие от этой части ключа.

Таблица наход-ся в 3НФ, если она удовл-т требованиям 2НФ и не содержит транзитивных зависимостей. Транзитивн завис-ть – функциональн завис-ть между неключ полями.

Алгоритм приведения к 3НФ (защита от непереключения фаз).

ШАГ1(приведение к 1НФ)-задается 1 или несколько отнош-й, отбраж-х понятия предметн обл-ти. По модели предметн обл-ти выпис-ся обнаруж-е функц-е завис-ти. Все отнош-я автомат-ки наход-ся в 1НФ. ШАГ2(приведение ко 2НФ)-если обнаружена завис-ть атрибутов от части сложн ключа, то проводится декомпозиция на несколько отношений: те атрибуты, которые зависят от части сложн ключа, выносятся в отдельн отнош-е вместе с этой частью ключа. В исходн отнош-и ост-ся все ключ атрибуты. ШАГ3(привед к 3НФ)-если обнаружена завис-ть некот-х неключ атрибутов др-х неключ атрибутов, то проводится декомпозиция этих отнош-й след образом: те неключ атрибуты, которые зависят от других неключ атрибутов вынос-ся в отдельн отнош-е. В новом отнош-и ключом становится детерминант функ-й завис-ти.

3.18 концептуальное проектирование, его цель, процедуры. Цель концептуальн проект-вания-создание концептуальн модели данных исходя из представлений пользователя о предметной обл-ти. Концептуальн проектир-ние: 1) анализ требований к БД: выявление представлений конечных пользователей и требований к обработке транзакций. 2) моделир-ние связей сущностей и нормализация; определение сущностей, атрибутов и связей, построение ER-диаграмм, нормализация таблиц. 3) проверка модели данных: правила ввода, обновления и удаления, проверка отчетов, запросов, представлений. 4) проектирование распределенной БД: определение местополож-я таблиц, требований доступа и стратегии фрагментирования.

Процедуры: 1) определение сущностей и их документирование: для идентификации сущностей определяются объекты, кот сущ-ют независимо от других. Такие объекты явл-ся сущностями. Каждой сущности присваивается осмысленное имя, понятное пользователям. Имена и описания сущностей заносятся в словарь данных. 2) создание семантической модели предметной области. 3) определение связей между сущностями и их документирование: Определяются только те связи между сущностями, кот необходимы для удовлет-ния требований к проекту БД. Устанавливается тип каждой из них. Выявляется класс принадлежности сущностей. Связям присваиваются осмысленные имена, выраженные глаголами. Развернутое описание каждой связи с указанием ее типа и класса принадлежности сущностей, участвующих в связи, заносится в словарь данных. 4) обсуждение концептуальной модели данных с конечными пользователями - если будут обнаружены несоответствия предметной области, то в модель вносятся изменения до тех пор, пока пользователи не подтвердят, что предложенная им модель адекватно отображает их личные представления.

3.19. Логическое проектирование, цель, процедуры Цель – преобразование концептуальной модели на основе выбранной модели данных в логическую модель, не зависимую от особенностей используемой в дальнейшем СУБД для физической реализации БД.

Результат: - логич структура БД, которая представляет собой схему, описанную в терминах языка описания данных - функционирование спецификации программных модулей и набор возможных запросов к БД.

Процедуры: 1) определение набора таблиц из ER-модели и их документирование-для каждой сущности ER-модели создается таблица. Имя сущности – имя таблицы. Устанавливаются связи между таблицами посредством механизма первичных и внешних ключей. Структуры таблиц и установленные связи между ними документируются. 2) проверка логической модели данных на предмет выполнения всех транзакций, предусмотренных пользователями. Транзакция – набор действий, выполняемых отдельным пользователем или прикладной программой с целью изменения содержимого БД. 3) определение требований поддержки целостности данных и их документирование – эти требования представляют собой ограничения, которые вводятся с целью предотвратить помещение в БД противоречивых данных. 4)создание окончательного варианта логической модели данных и обсуждение его с пользователями – подготавливается окончательный вариант ER-модели , представляющей логическую модель данных.

3.20 физическое проектирование, цель, процедуры Цель этапа физическ проектирования- описание конкретной реализации БД, размещаемой во внешней памяти компьютера. Процедуры физич проектир-я:1 проектир-ние таблиц БД средствами выбранной СУБД – осущ-ся выбор реляционной СУБД, которая будет использ-ся для создания БД, размещаемой на машинных носителях. Изучаются ее функциональные возможности по проектир-ю таблиц. Затем выполняется проектир-ние таблиц и схемы их связи в среде СУБД. Подготовленный проект БД описывается в сопровождаемой документации.

2 проектир-е физической организации БД. На этом шаге выбирается наилучшая файловая организация для таблиц. Выявляются транзакции, которые будут выполняться в проектируемой БД, и выделяются наиболее важные из них. Анализируется пропускная способность транзакций-кол-во транзакций, которые могут быть обработаны за заданный интервал времени, и время ответа – промежуток времени, необходимый для выполнения одной транзакции. Стремятся к повышению пропускной способности транзакций и уменьшению времени ответа. На основании указанных показателей принимаются решения об оптимизации производительности БД путем определения индексов в таблицах, ускоряющих выборку данных из базы, или снижения требований к уровню нормализации таблиц. Проводится оценка дискового объема памяти, необходимого для размещения создаваемой БД. Стремятся к его минимизации.

3 разработка стратегии защиты БД. БД- ценный корпоративный ресурс, поэтому орг-ции ее защиты уделяется много внимания. Для этого проектировщики должны иметь полное и ясное представление обо всех средствах защиты, представляемых выбранной СУБД.

4 орг-ция мониторинга функц-ния БД и ее настройка. После создания физического проекта БД организуется непрерывное слежение за ее функционированием. Полученные сведения об уровне производительности БД используются для ее настройки. Для этого привлекаются и средства выбранной СУБД.

3.21. Семантическая объектная модель. Пример объектной диаграммы. Любая развитая семантическая модель данных, как и реляционная модель, включает структурную, манипуляционную и целостную части, главным назначением семантических моделей явл обеспечение возможности выражения семантики данных. Наиболее часто на практике семантическое моделирование использ-ся на 1-ой стадии проектирования БД. При этом в терминах семантической модели производится концептуальная схема БД, кот затем вручную преобразуется к реляционной (или какой-либо другой) схеме. Этот процесс выполняется под управлением методик, в кот достаточно четко оговорены все этапы такого преобразования. Менее часто реализуется автоматизированная компиляция концептуальной схемы в реляционную. При этом известны два подхода: на основе явного представления концептуальной схемы как исходной информации для компилятора и построения интегрированных систем проектирования с автоматизированным созданием концептуальной схемы на основе интервью с экспертами предметной области. И в том, и в другом случае в результате производится реляционная схема базы данных в третьей нормальной форме.

Например семантическая модель данных - модель "Сущность-Связи" (часто ее наз кратко ER-моделью). На использовании разновидностей ER-модели основано большинство современных подходов к проектированию баз данных (главным образом, реляционных). Модель была предложена Ченом (Chen) в 1976 г. Моделирование предметной области базируется на использовании графических диаграмм, вкл-щих небольшое число разнородных компонентов. В связи с наглядностью представления концептуальных схем баз данных ER-модели получили широкое распространение в системах CASE. Основными понятиями ER-модели являются сущность, связь и атрибут. Сущность - это реальный или представляемый объект, информация о кот должна сохраняться и быть доступна. В диаграммах ER-модели сущность представляется в виде прямоугольника, содержащего имя сущности. Связь - это графически изображаемая ассоциация, устанавливаемая между двумя сущностями. Эта ассоциация всегда является бинарной и может существовать между двумя разными сущностями или между сущностью и ей же самой (рекурсивная связь). Связь представляется в виде линии, связывающей две сущности или ведущей от сущности к ней же самой. При это в месте "стыковки" связи с сущностью используются трехточечный вход в прямоугольник сущности.. Обязательный конец связи изображается сплошной линией, а необязательный - прерывистой линией.

В изображенном ниже примере связь между сущностями БИЛЕТ и ПАССАЖИР связывает билеты и пассажиров. При том конец сущности с именем "для" позволяет связывать с одним пассажиром более одного билета, причем каждый билет должен быть связан с каким-либо пассажиром. Конец сущности с именем "имеет" означает, что каждый билет может принадлежать только одному пассажиру, причем пассажир не обязан иметь хотя бы один билет.