Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
КИТ.docx
Скачиваний:
8
Добавлен:
14.08.2019
Размер:
93.09 Кб
Скачать

5. Внутримашинная организация данных 5.1. Файловая организация данных

В первые годы автоматизированной обработки информации (50-е - начало 60-х годов ХХ века) использовалась файловая организация данных. Данные хранились в файлах последовательного доступа. Файл - это спе­циальным образом организованная и поименованная совокупность данных, размещенных на внешних запоминающих устройствах и воспринимаемых в процессе обработки как единое целое. Прикладные программы обрабаты­вали файл целиком. В 60-е годы, когда широко распространились устрой­ства прямого доступа (магнитные диски), приобрели популярность файлы произвольного доступа. Этот метод доступа к данным позволил напрямую обращаться к нужной записи и не обрабатывать весь файл.

По мере совершенствования методов управления народным хозяйст­вом создавались автоматизированные информационные системы, которые поначалу имели файловую организацию данных. Такие системы обладали рядом недостатков:

  • жесткая связь данных и прикладных программ: описание данных включалось непосредственно в программу; значит если изменялась органи­зация данных, то переделывалась и программа, что требовало больших за­трат труда программиста. В результате программы оказывались узкоспе­циализированными;

  • дублирование данных за счет того, что одни и те же данные использо­вались в разных программах и в результате этого большие затраты на про­цесс обработки данных;

  • ограниченные возможности в обработке данных, так как любая их об­работка требовала создания своей программы, а значит низкая скорость об­работки в целом всех данных;

  • ограниченный контроль данных;

  • отсутствие надежных средств в обеспечении сохранности и целостно­сти данных;

  • недостаточные возможности управления данными.

Недостатки файловой организации, а также необходимость централи­зации данных, коллективного доступа к ним, повышенные требования к скорости обработки и достоверности данных обусловили появление баз данных (БД), которые позволили обеспечивать более эффективный доступ к данным и их обработку.

5.2. Понятие базы данных

Термин база данных обычно связывают с компьютерами. В действи­тельности базы данных появились задолго до компьютеров. Представление о базе данных может дать записная книжка, заполненная однотипными за­писями, содержащими, например, такие данные: фамилии, имена, отчества, телефоны, адреса, даты рождения. Другими примерами базы данных может служить библиотечная картотека, картотека учет кадров, расписание дви­жения поездов. То есть любая база данных содержит набор данных, пред­ставляющих собой совокупность взаимосвязанных сведений о некотором объекте.

Пользоваться реальными базами данных без применения компьютера достаточно сложно, поэтому современные базы данных компьютеризиро­ваны. База данных - это совокупность данных, организованных по опреде­ленным правилам, предусматривающим общие принципы описания, хране­ния и манипулирования данными, независимо от прикладных программ (ГОСТ 20886-85).

Другими словами, под базой данных понимается вся необходимая для решения задач в конкретной области совокупность данных, организованная по определенным правилам, позволяющим обеспечить независимость дан­ных от прикладных программ, удобство хранения, поиска, манипулирова­ния данными, которые записаны на машинных носителях.

Базы данных представляют собой интегрированную систему инфор­мации, в которой:

  • отсутствует тесная связь данных и обрабатывающих их программ;

  • значительно сокращена избыточность данных за счет ликвидации их дублирования;

  • совместно используются данные различными пользователями для ре­шения широкого круга задач;

  • удобен доступ к данным за счет стандартной их организации;

  • упрощен процесс организации защиты данных;

  • значительно снижены затраты на все виды манипуляции с данными, особенно в процессе их актуализации;

  • имеются достаточно гибкие и удобные формы эксплуатации данных, которые постоянно совершенствуются, будучи не зависимыми от самих данных.

Основное достоинство компьютерных баз данных в том, что к храня­щимся в них сведениям возможен быстрый доступ. При этом поиск нуж­ных данных может быть осуществлен по различным признакам и их сово­купностям. Например, к записной книжке удобно обратиться только по ал­фавиту, а к компьютерной базе данных сотрудников предприятия можно обратиться, получив сведения о том, какие сотрудники имеют трех и более детей, кто из сотрудников в отпуске и т.д. И ответ на любой заданный во­прос будет быстро удовлетворен. Преимущество компьютерной базы дан­ных в компактном представлении больших объемов данных на машинных носителях и удобстве их использования. Обобщая все сказанное, можно сказать, что главное в компьютерных базах данных - качественно новые возможности в работе с данными за счет новых информационных техноло­гий.

В каждой базе данных отражается своя предметная область, то есть

совокупность объектов реального мира с их связями, относящихся к неко­торой области и имеющих практическую ценность для пользователей. Ре­альные базы данных состоят из множества связанных файлов, разделенных различными пользователями.

Для поддержки адекватного отображения состояний предметной области базу данных необходимо динамически, в процессе функциониро­вания, обновлять, то есть актуализировать содержимое базы данных в соответствии с теми изменениями, которые происходят в предметной об­ласти.

Таким образом, база данных является динамической информационной моделью некоторой предметной области, отображением внешнего мира: объектов, явлений, процессов и состоящая из нескольких файлов. Каждому объекту присущ ряд характерных для него свойств (признаков, парамет­ров). Например, объекту студент присущи следующие свойства: ФИО, но­мер зачетки, факультет, курс, группа. Между элементами объекта фиксиру­ется и поддерживается связь.

Пользователями базы данных могут быть различные прикладные про­граммы, а также специалисты предметной области, выступающие в роли потребителей или источников данных, называемые конечными пользовате­лями. Обслуживанием базы данных занимается администратор базы.

В теории баз данных нашли применение достижения ряда областей информатики: языки и технология программирования, системы искусст­венного интеллекта. Здесь используется также и математический аппарат: теория множеств, алгебра и математическая логика, теория графов и опти­мизационные методы, техника имитационного моделирования.

Наряду с разработкой научных основ сформировалась и практическая технология баз данных. Создана методология проектирования и эксплуата­ции систем баз данных, имеющая развитые инструментальные средства для разработчиков таких систем и персонала администратора баз, для разнооб­разных по характеру потребностей и по уровню квалификации категорий пользователей.

Создание базы данных представляет трудоемкий процесс, требующий определенной квалификации. При разработке надо учитывать следующие требования:

  1. многократное использование данных;

  2. быстрый поиск и получение информации по запросам пользователей;

  3. простоту обновления данных;

  4. уменьшение излишней избыточности данных;

  5. отсутствие дублирования данных в различных компонентах БД, обеспе­чивающее однократный ввод данных;

  6. защиту данных от несанкционированного доступа, от искажения и унич­тожения;

  7. целостность базы - требование полноты, непротиворечивости и сохран­ности данных.

Современные базы данных имеют большой объем. Для его измерения применяются такие единицы, как Терабайт и Петабайт (1 Терабайт равен

12 15

10 байтов, 1 Петабайт— 10 байтов). База данных размещается на уст­ройствах для хранения больших объемов данных: жестких магнитных дис­ках, оптических компакт-дисках, оптических библиотеках. Так, оптические библиотеки позволяют организовать динамический доступ к информации объемом от нескольких десятков Гигабайт до 5-6 Терабайт. В этих устрой­ствах может быть установлено свыше 500 компакт-дисков разного форма­та.

По технологии обработки данных современные базы данных бывают: централизованные и распределенные.

Централизованные (сосредоточенные) базы данных хранятся в памяти одной вычислительной системы. Если эта вычислительная система являет­ся компонентом сети ЭВМ, то возможен распределенный доступ к такой базе.

Распределенные базы данных состоят из нескольких, возможно пере­секающихся или даже дублирующих друг друга частей, хранимых в раз­личных ЭВМ вычислительной сети. Такой способ использования базы дан­ных часто применяется в локальных сетях персональных компьютеров. Ра­бота с такой базой данных осуществляется с помощью системы управления распределительной базой данных.

По способу доступа к данным базы данных делятся на базы данных с локальным доступом и базы данных с удаленным сетевым доступом.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]