Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Інформаційно-комунікаційне забезпечення фінансової діяльності навчальний посібник

.pdf
Скачиваний:
31
Добавлен:
29.03.2016
Размер:
5.31 Mб
Скачать

6.Формальний апарат обмежень на формування відношень (таблиць), що дозволяє усунути дублювання, забезпечує несуперечливість збережених у базі даних, зменшує трудовитрати на ведення (уведення, коректування) бази даних, – це:

а) СУБД; б) функціональна залежність;

в) модель даних; г) нормалізація відношень.

7.Яка зі структур даних має багато "точок входу":

а) ієрархічна; б) мережева; в) вузлова; г) реляційна;

д) структурна?

8. Встановіть зв'язок між визначенням та термінами

Первинний ключ

зворотний покроковий процес заміни даної сукупності

 

відношень іншою схемою з усуненням надлишкових

 

функціональних залежностей;

Нормалізація

сукупність атрибутів даних, що описують певний об'єкт;

Вузол

одне чи декілька полів, що однозначно ідентифікують

 

запис;

База даних

множина однакових за структурою записів зі значен-

 

нями в окремих полях;

Файл

інформаційна модель, що дозволяє впорядковано

 

зберігати дані про групу об'єктів, що мають однаковий

 

набір властивостей.

9.Будь-який атрибут відношення, який не міститься в будь-якому первинному чи можливому ключі відношення, називається:

а) зовнішнім ключем; б) незалежним атрибутом; в) незалежним ключем;

г) неключовим атрибутом.

10.Дворівневий граф, який пов'язує відношенням "один-до-ба- гатьох" два типи запису, називається:

а) ключем; б) набором; в) агрегатом.

61

Практичні завдання

Завдання 2.1. Виконайте проектування БД в MS Access за заданою предметною областю. Нормалізуйте наведене відношення та спроектуйте всі необхідні таблиці (табл. 2.2).

Таблиця 2.2

Автоматизація роботи фондової біржі

Сектор ринку

Торговельний день

Початок торгів

Найменування емітента

Вид / Форма випуску / Тип

Рівень лістингу

Кількість контрактів, шт.

Кількість ЦП, шт.

Вартість контрактів, грн

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Завдання 2.2. Виконайте проектування БД в MS Access за заданою предметною областю. Нормалізуйте наведене відношення та спроектуйте всі необхідні таблиці (табл. 2.3).

Таблиця 2.3

Автоматизація торгів акціями із індексного кошика

Назва емітента

Вид цінних паперів

Рівень лістингу

Код емітента

Дата торгів

Купівля

Продаж

Максимум за день

Мінімум за день

Обсяги (грн)

Кількість угод

Капіталізація

Вага в індексі

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Завдання 2.3. Виконайте проектування БД в MS Access за заданою предметною областю. Нормалізуйте наведене відношення та спроектуйте всі необхідні таблиці (табл. 2.4).

Завдання 2.4. Виконайте проектування БД в MS Access за заданою предметною областю. Створіть таблиці в БД та встановіть між ними зв'я- зки.

Опис предметної області: cтрахова компанія.

62

Таблиця 2.4

Автоматизація обліку видів депозитних вкладів у банках України

Назва банку

Номер філії банку

Юридична адреса

філії

Вклад

Можливість

поповнення

Виплата відсотків

Часткове зняття

Мінімальна сума

вкладу

Строк вкладу

Ставка, річних

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Завданням є відстеження її фінансової діяльності. Компанія має різні філії по всій країні. Кожна філія має назву, адресу і телефон. Діяльність компанії організована таким чином: до неї звертаються різні особи з метою укладення договору про страхування. Залежно від об'єктів, що приймаються на страхування, і страхованих ризиків договір укладається за певним видом страхування (наприклад, страхування автотранспорту від викрадення, страхування домашнього майна, добровільне медичне страхування).

У процесі укладення договору фіксується дата укладення, страхова сума, вид страхування, тарифна ставка і філія, в якій уклався договір.

Можливий набір сутностей:

ДОГОВОРИ (номер договору, дата укладення, страхова сума, тарифна ставка, код філії, код виду страхування).

ВИД СТРАХУВАННЯ (код виду страхування, найменування). ФІЛІЯ (код філії, найменування філії, адреса, телефон).

Завдання 2.5. Виконайте проектування БД в MS Access за заданою предметною областю. Створіть таблиці в БД та встановіть між ними зв'язки.

Опис предметної області: видача банком кредитів.

Завданням є відстеження динаміки роботи кредитного відділу. Залежно від умов отримання кредиту, процентної ставки і терміну повернення всі кредитні операції поділяються на декілька основних видів. Кожен з цих видів має свою назву. Кредит може отримати клієнт під час реєстрації, надавши наступні відомості: назву, вид власності, адресу, те-

63

лефон, контактну особу. Кожен факт видання кредиту реєструється банком, при цьому фіксуються сума кредиту, клієнт і дата видачі.

Можливий набір сутностей:

ВИДИ КРЕДИТІВ (код виду, назва, умови отримання, ставка, термін).

КЛІЄНТИ (код клієнта, назва, вид власності, адреса, телефон, контактна особа).

КРЕДИТИ (код виду, код клієнта, сума, дата видачі).

Література: [6; 8; 19; 23; 27; 30; 31; 37; 40; 45; 49; 60; 64; 88; 92; 97; 101; 102; 134; 143].

Тема 3. Інформаційні технології обробки та збереження даних

Мета – вивчення теоретичних основ і принципів побудови сховищ даних, набуття практичних навичок операційної та аналітичної обробки даних.

Основні питання

3.1.Технології OLTP і OLAP та їх особливості.

3.2.Схеми подання багатовимірних даних.

3.3.Концепції організації збереження даних.

3.4.Сучасні системи збереження даних.

3.5.Зовнішні дискові системи збереження даних.

3.6.Стрічкові системи збереження даних.

Компетентності, що формуються за темою:

знання: відмінностей між оперативними та аналітичними даними, класифікації OLAP, властивостей технологій OLAP та OLTP, схеми подання даних, поняття сховищ даних, сутностей поняття "система збереження даних" та її основних особливостей, різновидів та характеристик систем збереження інформації;

уміння: аналізувати фінансові дані за допомогою OLAPта OLTPтехнологій, складати запити до OLAPта OLTP-баз даних, виконувати обчислення у базі даних відповідно до запитів, досліджувати економічні

64

дані для формування інформаційної бази управління фінансами, аналізувати документаційне забезпечення управлінської діяльності та обирати відповідну систему збереження даних;

комунікації: донесення до фахівців і нефахівців інформації, проблем, рішень та власного досвіду в галузі інформаційно-комунікаційних технологій;

автономність і відповідальність: визначення особливостей та зако-

номірностей формування систем збереження даних і сховищ даних фінансової діяльності.

Ключові терміни: сховище даних, OLTPта OLAP-технології, транзакція, схема сховищ даних, система збереження даних, стрічкові системи зберігання даних, дискові системи зберігання даних, вітрина даних, магнітна стрічка.

3.1. Технології OLTP і OLAP та їх особливості

Інформаційні технології обробки даних призначені для розв'язання добре структурованих задач, для яких є необхідні вхідні дані і відомі алгоритми та інші стандартні процедури їх опрацювання. На рівні операційної діяльності використовують так звані технології операційної обробки –

OLTP (Online Transaction Processing) – обробка транзакцій в реальному часі. У спосіб організації БД, за якого система працює з невеликими за розмірами транзакціями, які йдуть великим потоком, і при цьому клієнтові потрібен від системи максимально швидкий час відповіді.

Транзакція – дія або ряд дій, які виконуються одним користувачем або прикладною програмою, що здійснюють зчитування або зміну вмісту бази даних [91].

OLTP-системи призначені для введення, структурованого збереження і обробки інформації (операцій, документів) у режимі реального часу.

OLTP-додатками охоплюється широкий спектр завдань у багатьох галузях – банківські та біржові операції, в промисловості – реєстрація проходження деталі на конвеєрі, фіксація в статистиці відвідувань чергового відвідувача веб-сайта, автоматизація бухгалтерського, складського обліку і обліку документів тощо.

65

Вимоги:

дуже нормалізовані моделі даних; у разі виникнення помилки транзакція повинна цілком відкотитися і

повернути систему до стану, який був до початку транзакції; обробка даних у реальному часі.

Недоліки:

OLTP-системи оптимізовані для невеликих дискретних транзакцій. А запити на комплексну інформацію (наприклад щодо покварталь-

ної динаміки обсягів кредитів за певним видом кредиту в зазначеній філії), характерні для аналітичних додатків (OLAP), породжують складні по'єднання таблиць і перегляд таблиць у цілому. На один такий запит піде маса часу і комп'ютерних ресурсів, що загальмує обробку поточних транзакцій.

Реляційні бази даних зберігають сутності в окремих таблицях, які зазвичай добре нормалізовані. Ця структура зручна для операційних БД (систем OLTP), але складні багатотабличні запити в ній виконуються відносно повільно.

Кращою моделлю для запитів, а не для зміни, є просторова БД. OLAP робить миттєвий знімок реляційної БД і структурує її в просторову модель для запитів. Заявлений час обробки запитів в OLAP складає близько 0,1 % від аналогічних запитів у реляційну БД.

OLAP (англ. online analytical processing, аналітична обробка в реальному часі) – технологія обробки інформації, що включає складання та динамічну публікацію звітів і документів. Використовується аналітиками для швидкої обробки складних запитів бази даних.

Причина використання OLAP для обробки запитів – це швидкість.

У 1993 році Кодд Е. Ф. сформулював дванадцять основних правил, які повинні стати основою для вибору найбільш доцільних інструментів OLAP. Публікація цих правил була результатом дослідження, проведеного в інтересах компанії Arbor Software (творців пакета Essbase), і призвела до появи формального визначення вимог, висунутих до інструментів

OLAP [71]:

1.Багатовимірна концепція даних. OLAP оперує даними CUBE, які

єбагатовимірними масивами. Кількість вимірювань OLAP-кубів необмежена.

2.Прозорість. OLAP системи повинні спиратися на відкриті системи, що підтримують гетерогенні джерела даних.

66

3.Доступність. OLAP системи повинні надавати користувачеві єдину логічну схему даних.

4.Постійна швидкість виконання запитів. Продуктивність не по-

винна падати в разі зростання кількості вимірювань.

5.Клієнт / сервер архітектура. Системи повинні базуватися на відкритих інтерфейсах і мати модульну структуру.

6.Різна кількість вимірювань. Системи не повинні обмежуватися тривимірною моделлю подання даних. Вимірювання повинні бути еквівалентними за застосуванням будь-яких функцій.

7.Динамічне подання розріджених матриць. Під розрідженою мат-

рицею розуміють таку матрицю, не кожна клітинка якої містить дані. OLAP-системи мають містити засоби зберігання й обробки розріджених матриць великих обсягів.

8.Підтримка, розрахована на багатьох користувачів. OLAP-

системи повинні підтримувати багатокористувацький режим роботи.

9.Необмежені багатовимірні операції. Аналогічно до вимоги про різну кількість вимірювань усі вимірювання вважаються рівними, і багатовимірні операції не повинні накладати обмежень на відносини між комірками.

10.Інтуїтивно зрозумілі інструменти маніпулювання даними. Для формулювання багатовимірних запитів користувачі не повинні працювати з ускладненими меню.

11.Гнучка настройка кінцевих звітів. Користувачі повинні мати можливість бачити тільки те, що їм необхідно, причому всі зміни даних повинні негайно відображатися у звітах.

12.Відсутність обмежень. Не повинно бути будь-яких обмежень щодо кількості вимірювань і рівнів агрегації даних.

Базова OLAP-структура, створена з робочих даних, називається OLAP-куб. OLAP-куб включає базові дані та інформацію про вимірювання (агрегати). Куб потенційно містить всю інформацію, яка може знадобитися для відповідей на будь-які запити. Через величезну кількість агрегатів часто повний розрахунок відбувається тільки для деяких вимірювань, для решти ж проводиться "на вимогу" [91].

Факт (показник) – це числова величина, яка розташовується в осередках гіперкуба. Один OLAP-куб може характеризуватися одним або декількома показниками.

67

Осередок (комірка) (cell) – атомарна структура куба, яка відповідає повному набору конкретних значень вимірювань.

Вимірювання (dimension) – це множина об'єктів одного або декількох типів, організованих у вигляді ієрархічної структури і які забезпечують інформаційний контекст числового показника. Вимірювання прийнято візуалізувати у вигляді ребра багатовимірного куба.

Об'єкти, сукупність яких утворює вимірювання, називаються членами вимірювань (members). Члени вимірювань візуалізують точки або частки, що відкладаються на осях гіперкуба.

Ієрархія – групування об'єктів одного вимірювання в об'єкти більш високого рівня. Наприклад: день, місяць, рік. Ієрархії у вимірюваннях необхідні для можливості агрегації і деталізації значень показників згідно з їх ієрархічною структурою. Ієрархія цілковито ґрунтується на одному вимірюванні та формується з рівнів. У рамках OLAP-технологій на основі того, що багатовимірне поданне даних може бути організоване як засобами реляційних СУБД, так і багатовимірними спеціалізованими засобами, розрізняють три типи багатовимірних OLAP-систем [7; 148; 153]:

багатовимірний (Multidimensional) OLAP – MOLAP;

реляційний (Relation) OLAP – ROLAP;

змішаний, або гібридний (Hibrid) OLAP – HOLAP.

ROLAP. На сьогодні в масових засобах, що забезпечують аналітичну роботу, переважає використання інструментів на основі реляційного підходу. Перевагами ROLAP-систем є такі:

можливість оперативного аналізу даних, які безпосередньо містяться у сховищі, оскільки більшість вихідних баз даних належать до реляційного типу;

у випадку змінної розмірності задачі виграють ROLAP, оскільки не потрібна фізична реорганізація бази даних;

ROLAP-системи можуть використовувати менш потужні клієнтські станції і сервери, причому на сервери лягає основне навантаження з обробки складних SQL-запитів;

рівень захисту інформації та розмежування прав доступу в реляційних СУБД незрівнянно вищий, ніж у багатовимірних.

Недоліком ROLAP-систем є менша продуктивність, необхідність ретельного опрацювання схем бази даних, спеціальна настройка індексів, аналіз статистики запитів і врахування висновків аналізу під час доопра-

68

цювання схем баз даних, що призводить до значних додаткових трудовитрат.

Виконання ж цих умов дозволяє в процесі використання ROLAPсистем досягти схожих з MOLAP-системами показників відносно часу доступу, і навіть перевершити в економії пам'яті.

MOLAP – це класична форма OLAP, так що її часто називають просто OLAP. У багатовимірних СУБД дані організовані у вигляді не реляційних таблиць, а впорядкованих багатовимірних масивів або гіперкубів, коли всі збережені дані повинні мати однакову розмірність, що означає необхідність утворювати максимально повний базис вимірювань. Дані можуть бути організовані у вигляді полікубів, у цьому варіанті значення кожного показника зберігаються з власним набором вимірювань, обробка даних проводиться власним інструментом системи.

Перевагами MOLAP є:

більш швидке, ніж із ROLAP, отримання відповідей на запити – витрачається час, на один-два порядки менший;

через обмеження SQL ускладнюється реалізація багатьох вбудованих функцій.

До обмежень MOLAP належать:

порівняно невеликі розміри баз даних (межа – десятки гігабайт); використання у 2,5 – 100 разів більше пам'яті, ніж у вихідних даних

за рахунок денормалізації і попередньої агрегації багатовимірних масивів;

відсутність стандартів на інтерфейс і засобів маніпулювання дани-

ми;

обмеження в процесі внесення даних.

HOLAP знаходиться між цими двома підходами, він досить добре масштабується і швидко обробляється.

HOLAP – є поєднанням інструментів, що реалізують реляційну і багатовимірну модель даних.

За такого підходу використовуються переваги перших двох підходів і компенсуються їх недоліки. У найбільш розвинених програмних продуктах такого призначення реалізований саме цей принцип.

Використання гібридної архітектури в OLAP-системах – це найбільш прийнятний шлях вирішення проблем у застосуванні програмних інструментальних засобів у багатовимірному аналізі.

69

Коло завдань, що ефективно розв'язуються кожною із систем, можна визначити на основі порівняльних характеристик OLTP- і OLAPсистем (табл. 3.1).

 

 

Таблиця 3.1

Порівняння OLTP- і OLAPсистем [7; 148; 153]

 

 

 

Характеристика

OLTP

OLAP

 

 

 

Вид діяльності

Оперативна, тактична

Аналітична, стратегічна

 

 

 

Частота оновлення

Висока частота, невеликі

Мала частота, великі "порції"

даних

"порції"

 

 

 

 

Джерела даних

В основному внутрішні

Відносно аналітичної систе-

 

 

ми в основному зовнішні

 

 

 

Тривалість зберігання

Поточні (декілька міся-

Історичні (за роки) і прогнозні

даних

ців)

 

 

 

 

Тип даних

Структуровані

Різнотипні

 

 

 

Рівень агрегації даних

Деталізовані дані

В основному агреговані дані

 

 

 

Можливості аналітичних

Регламентовані звіти

Послідовність інтерактивних

операцій

 

звітів, динамічна зміна рівнів

 

 

агрегації і зрізів даних

 

 

 

Типи запитів

Передбачувані (регла-

Довільні

 

ментовані)

 

 

 

 

Типи запитань

Скільки? Як? Коли?

Чому? Що буде, якщо?

 

 

 

Переважні операції

Введення даних, пошук

Аналіз даних

 

 

 

Призначення системи

Фіксація, оперативний

Робота з історичними дани-

 

пошук та обробка даних,

ми, аналітична обробка, про-

 

регламентована аналі-

гнозування, моделювання

 

тична обробка

 

 

 

 

3.2. Схеми подання багатовимірних даних

Багатовимірні дані можуть бути відображені інструментами у вигляді СУБД на основі реляційних моделей даних, а також спеціальними багатовимірними інструментальними засобами.

Подання багатовимірних даних в рамках реляційних моделей може виконуватися у вигляді трьох варіантів схем [6; 148]:

"зірка"; "сніжинка"; "сузір'я".

70