Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по КИС.docx
Скачиваний:
29
Добавлен:
08.12.2018
Размер:
371.02 Кб
Скачать
  • Повышение качества информации в хд

  • На выходе – очищенные данные. Процесс трудоемкий.

  • Основные причины ошибок и некачественных данных:

  1. Человеческий фактор;

  2. Технологические проблемы;

  3. Процесс проектирования.

  • Методы оценки данных:

  1. Визуальная или ручная:

  • последовательный вывод данных на экран;

  • выполнение специфических выборок;

  • опрос пользователей и обслуживающего персонала об известных им ошибках.

  1. Автоматизированный (с использованием программных средств).

  • Программные средства делаться на:

  • Программный аудитор (обнаружение ошибок без их исправления);

  • Программа выведения закономерностей;

  • Программа очистки (выявление ошибок и их исправление);

  • Программа профилактики.

  • Концептуальные модели хд

  • 6 основных моделей:

  1. Неуправляемое развитие систем поддержки принятия решений;

  • Достоинства:

  • Не требуют больших затрат в краткосрочной перспективе;

  • Легко реализуются;

  • Используются существующие технические средства;

  • Не нуждаются в централизованном планировании.

  • Недостатки:

  • Дублирование программ извлечения данных и формирования отчетов;

  • Не является ХД.

  1. Виртуальное ХД:

  • Достоинства:

  • Максимальное использование существующего ПО;

  • Основной объем работ выполняет унаследованный источник данных.

  • Недостатки:

  • Производительность выполнения запросов ограничена архитектурой;

  • Унаследованные системы могут обладать разной структурой полей;

  • Возможность получения разных результатов на один и тот же запрос, но выполненные в разное время.

  1. Семантическая интеграция предметных областей (оперативные системы)

  • Достоинства:

  • Предметные области можно конструировать независимо друг от друга;

  • Появляется возможность проектировать и реализовывать предметные области по мере появления финансовых средств;

  • Недостатки:

  • Пользователи должны понимать взаимосвязь предметных областей;

  • Отсутствует возможность абстрагироваться от структуры размещения данных в предметных областях.

  1. Управление запросами к предметным областям

  • Недостатки:

  • На операцию слияния предметных областей тратятся большие ресурсы.

  1. Монолитное хранилище

  • Достоинства:

  • Высокая скорость работы;

  • Недостатки:

  • Избыточность данных;

  • Требуются значительные затраты.

  • Выбор архитектуры хд

  • Факторы выбора:

  1. Величина проектного бюджета;

  2. Количество специалистов;

  3. Время реализации проекта;

  4. Структура организации;

  5. Опыт организации в области систем принятия решений и ХД.

  1. Неуправляемое развитие СППР

  • Данный тип архитектуры предпочтителен организациям, у которых она уже частично реализована и имеется большой опыт использования.

  • Область применения: если подразделения в организации испытывают потребность каждый в своем небольшом хранилище данных и не существует проблемы несогласованность данных между подразделениями. Есть свои инструментарии с данными каждой предметной области и некритично несоответствие некоторых данных.

  1. Виртуальное ХД

  • Проблемы:

  1. Несогласованность ключей и индексов, которые не допускают соединение таблиц

  2. Поля систем источников не согласованы между собой

  3. Ошибочные данные систем источников воспроизводятся в ХД

  • Подходит для организаций осуществляющих розничную торговую сеть. Общий идентификатор товаров – универсальный артикул или штрих-код

  • Семантическая интеграция предметных областей (для организаций, нуждающихся в быстром получении результата с ограниченным бюджетом).

  1. Управление запросами по предметным областям (является наиболее совершенным типом архитектуры, используется в тех же случаях что и предыдущий тип, но требует больших затрат на реализацию)

  2. Монолитное хранилище

  • Условия:

  1. Организация обладает значительным бюджетом;

  2. Организация имеет большое количество специалистов на длительное время;

  3. Организация отличается высоким уровнем централизации;

  4. Организация готова подождать несколько лет.

  • Физическая архитектура ХД

  1. Mainframe;

  2. Клиент – Сервер;

  3. Клиент - Сервер Приложений - Сервер БД;

  4. Клиент – Сервер Приложений – Сервер БД – Подсистема Памяти;

  5. Клиент – Сервер Приложений – Сервер Запросов – Сервер БД – Подсистема Памяти.

  • Подсистема Памяти (ПСП)

  • В качестве физических дисков часто используются RAID-массивы (зеркальные). Наличие RAID’ов не освобождает от необходимости резервного копирования.

  • Используют различные ухищрения:

  • BCV - Том обеспечения бесперебойного бизнес-процесса

  • Базы данных

  • Современная СУБД для ХД должна уметь использовать несколько процессоров, несколько каналов ввода-вывода, несколько массивов ЖД.

  • В качестве СУБД для ХД рекомендуется использовать многомерные БД.

  • Аппаратное обеспечение сервера БД

  • Рекомендуемые компоненты:

  1. Набор быстродействующих процессоров;

  2. Большой объем оперативной памяти и КЭШа;

  3. Эффективная ОС;

  4. Развитые компиляторы генерирующие программный код или эффективное СУБД;

  5. Быстродействующая система хранения данных;

  6. Быстродействующая система ввода-вывода;

  • Операционные системы

  • Требования:

  1. Производительность:

  1. ОС д.б. параллельной;

  2. 64-разрядная адресация;

  3. Поддержка файловых систем с большими размерами файлов;

  4. Изменяемый размер станиц памяти.

  1. Устойчивость:

  1. Файловая система с регистрационным журналом для обеспечения целостности и процесса быстрого восстановления;

  2. Распределение страничной памяти, позволяющее автоматически определять страницы памяти, в которых произошел отказ без разрушения работающих приложений;

  3. Динамически загружаемые модуль ядра (например для загрузки новых драйверов без перезапуска ОС)

  1. Интеграция (ОС должна поддерживать стандарты открытых систем (или хотя бы сетевые протоколы))

  2. Безопасность (требование защиты и аудит)

  • Сервер запросов и сервер приложений

  • Сети и средства взаимодействия

  • … что то говорил… вроде бы никто не записывал 

  • Клиентские компьютеры (Клиенты)

  • Типы клиентов:

  1. «Тонкий клиент» - любое устройство, на котором может работать Web-браузер - планшеты;

  2. «Стандартные персональные компьютеры» - компьютеры, ноутбуки;

  3. Рабочие станции начального уровня;

  4. Рабочие станции высокого класса (многопроцессорные).

  • Системы электронного документооборота

  • Классы документов:

  1. Документы для автоматизации управленческой деятельности (письма, чат, общедоступные БД) – документы, не требующие отчетности;

  2. Критически важные документы – для решения управленческих задач, которые ставятся на контроль, отслеживаются (счета с ЭЦП, документы «под суд»).

  • Действия, выполняемые с документами:

  1. Создание документа (автор, время создания, статус (черновик, рабочий документ, секретный и т.п.));

  2. Утверждение