Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Вопросы ХД.doc
Скачиваний:
7
Добавлен:
26.08.2019
Размер:
154.11 Кб
Скачать

#ХД 1 модуль(бакалавры)БИ.

1) Укажите характерные черты хранилища данных.

Хранилище данных - Предметно-ориентированный, интегрированный, привязанный ко времени и неизменяемый набор данных, предназначенный для поддержки принятия решений.

  • ХД должно быть:

    • предметно-ориентированным,

    • интегрированным,

    • предназначенным для поддержки принятия решений.

  • Хранилище представляет собой среду накопления данных, которая оптимизирована для выполнения сложных аналитических запросов управленческого персонала.

Особенности информации:

  • предметная ориентированность;

  • интегрированность (целостность и внутренняя взаимосвязь);

  • временная привязка;

  • неразрушаемая совокупность данных.

2) Укажите базовые технологии сппр.

ХД - базовая технология современных СППР. - Data Mining, - Data Warehouse, - OLAP.

3) Какая технология используется в приложениях olap?

технология оперативной аналитической обработки данных

  • OLАР-инструменты создаются на основе концепции многомерной базы данных - данные организованы согласно многомерной модели, которая поддерживается специальной многомерной базой данных (Multi-Dimensional DatabaseMDDB) или реляционной базой данных, предназначенной для работы с многомерными запросами.

  • КУБ - Ключевой частью OLAP-системы является куб и содержащиеся в нем предварительно обработанные агрегаты. Обычно в OLAP-системах используется одна из трех архитектур хранения данных куба – Rolap, Molap, Holap

4) К какому типу относится система учета банковских платежей?

Транзакционная система

5) Транзакционные системы выполняют:

  • Транзакционные Системы (ТС) - системы или части информационных систем, ориентированные на операционную (системы операционной обработки данных), или транзакционную обработку данных; (ПРОИЗВОДЯТ КУЧУ МУСОРА-ДАННЫХ)

6) Какого вида базы данных используют OLTP системы :

Системы OLTP могут реализовываться на основе файл-серверных или клиент-серверных архитектур, имеют нормализованные реляционные структуры баз данных.

7) Укажите причины по которым база данных OLTP не пригодна для СППР.

  • сложная структура таблиц, специфических форматов представления данных

  • проблема организации эффективного доступа к данным транзакционных систем (их много и они заняты обработкой операций по учету данных).

  • учетные системы не в состоянии обеспечить представление данных в требуемом для анализа виде и с требуемым уровнем детализации

  • данные разнотипны и распределены как внутри организации, так и за её пределами

  • лицам, принимающим решения (ЛПР) и аналитикам приходится принимать решения не только в условиях неполной, но и зачастую недостоверной и противоречивой информации

  • к тому же не всегда удается получить требуемую информацию во время и в наглядном виде

8) Особенности аналитических запросов.

применяются к большим по объему базам данных, и выполнение таких запросов вызывает существенные накладные расходы СУБД

нормализованные реляционные структуры баз данных

менее регламентированы чем запросы использующиеся в отчетных системах (1-с)

9) Какой интервал времени охватывают данные в оперативных системах?

Оперативные системы охватывают небольшой интервал времени за счет периодического архивирования данных.

10) Компонент ХД «Менеджер загрузки» выполняет следующие функции:

  • анализ непротиворечивости и очистка данных

  • преобразование и перемещение исходных данных из временного хранилища в основные таблицы хранилища данных

  • создание индексов и представлений для базовых таблиц

  • денормализация данных (в случае необходимости)

  • обобщение данных (в случае необходимости)

  • резервное копирование и архивирование данных

11) К пользовательским инструментам доступа к данным относятся:

  • инструменты создания отчетов и запросов

  • инструменты разработки приложений

  • инструменты информационной системы руководителя (Executive Information System — EIS)

  • инструменты оперативной аналитической обработки (OLAP-инструменты)

  • инструменты разработки данных

12) Укажите проблемы хранилищ данных.

  • недооценка ресурсов, необходимых для загрузки данных

  • скрытые проблемы источников данных

  • отсутствие требуемых данных в имеющихся архивах

  • гомогенизация (однородность) данных

  • высокие требования к ресурсам

  • владение данными

  • сложное сопровождение

  • долговременный характер проектов

13) Укажите преимущества, которые можно получить при создании хранилищ данных.

    • Потенциально высокая отдача от инвестиций;

    • Повышение конкурентоспособности;

    • Повышение эффективности труда лиц, ответственных за принятие решений;

14) Хранилище данных включает следующие компоненты:

  • система автоматизации. исп. Менеджер загрузки

  • менеджер загрузки

  • менеджер хранилища

  • менеджер запросов

  • менеджер хранилища

  • инструменты генерации отчетов и разработки приложений

  • инструменты OLAP

  • инструменты «раскопки» данных Data maining

15) OLAP инструменты создаются на основе концепции:

на основе концепции многомерной базы данных

16) Архитектура ХД DWB (Data Warehouse Bus) Ральфа Кимболла (Ralph Kimball) предполагает:

  • использование пространственной модели организации данных с архитектурой "звезда" (star scheme)

  • использование двухуровневой архитектуры, которая включает стадию подготовки данных, недоступную для конечных пользователей, и хранилище

17) Архитектура ХД CIF (Corporate Information Factory) Билла Инмона (Bill Inmon) предполагает:

  • скоординированное извлечение данных из источников

  • накопление данных в централизованном хранилище

  • многомерный анализ данных в витринах

18) Унифицированная модель измерений UDM используется для:

поддержки архитектуры виртуального ХД

  • UDM позволяет строить OLAP-кубы непосредственно на основе данных транзакций.

UDM позволяет получать BI-данные непосредственно от OLTP-систем так, чтобы чрезмерно не нагружать эти системы. В результате отпадает необходимость в витринах данных

UDM не требует использования в качестве источника данных витрины данных со схемой звезды или снежинки. Годится любая нормально структурированная реляционная база данных.

19) Укажите логические модели ХД.

«Многомерный куб» (гиперкуб) dimensional

20) Укажите физичиские модели ХД.

«Звезда»

«Снежинка»

21) Схема ХД "Звезда" (star schema) обеспечивает:

высокую скорость выполнения запроса посредством денормализации и разделения данных.

22) Схема ХД "Снежинка" (snowflake schema) обеспечивает:

"снежинка" обеспечивает эффективную и точную работу с данными

23) Имеет ли соединение консольная таблица с таблицей фактов?

НЕТ консольная таблица не может быть связана таблицей факта

24) Выберите из списка возможные функции агрегирования?

COUNT- число значений в столбце,

SUM- сумма значений в столбце,

AVG- среднее значение в столбце,

MAX- самое большое значение в столбце,

MIN- самое малое значение в столбце.

25) Какая схема Снежинка или Звезда обладает большей эффективностью с точки зрения аналитических запросов?

Звезда

26) Центральная таблица в схеме "Звезда" называется:

таблицей фактов

27) Информация об агрегировании данных находится в:

таблицах измерений куба

28) В гиперкубе числовая информация для анализа находится:

в ячейках многомерного куба

29) Таблицы фактов могут содержать:

содержит уникальный составной ключ, объединяющий первичные ключи таблиц измерений

факты, связанные с транзакциями (Transaction facts)

факты, связанные с «моментальными снимками» (Snapshot facts)

факты, связанные с элементами документа (Line-item facts)

факты, связанные с событиями или состоянием объекта (Event or state facts)

30) Ячейка (cell) гиперкуба это:

атомарная структура куба, соответствующая конкретному значению некоторого показателя

31) Измерение (dimension) гиперкуба это:

способ ранжирования данных, используемый для разделения агрегированных мер на составляющие их части

32) Для однозначной идентификации ячейки гиперкуба необходимо:

указать комбинацию членов всех измерений и показатель

33) Выберите наиболее правильное определение - "Агрегат OLAP это":

значение, вычисляемое по некоторому множеству детализированных записей

34) Какие существуют типы иерархий в MS SQL?

сбалансированные (balanced)

несбалансированные (unbalanced)

неровные (?)

35) Иерархия, в которой число уровней определено её структурой и неизменно, и каждая ветвь иерархического дерева содержит объекты каждого из уровней:

сбалансированная

36) Иерархия, в которой число уровней может быть изменено, и каждая ветвь иерархического дерева может содержать объекты, принадлежащие не всем уровням, а только нескольким первым:

несбалансированная

37) Используемые архитектуры OLAP:

многомерный OLAP-формат (Multi-dimensional OLAP - MOLAP)

реляционный OLAP-формат (Relational OLAP - ROLAP)

гибридный OLAP-формат (Hybrid OLAP - HOLAP)

38) Укажите особенности MOLAP.

является многомерным форматом хранения данных, который отличается высоким быстродействием.

обеспечивает наилучшее быстродействие

предназначен для небольших или средних объемов данных

низкий коэффициент использования дискового пространства

набор информационных измерений стабилен

39) Укажите особенности ROLAP.

анализ непосредственно хранилища данных

наличие переменной размерности задачи

имеют динамическое представление размерности

более высокий уровень защиты данных и хорошие возможности разграничения прав доступа

меньшая производительность (чем у MOLAP)

40) Укажите компоненты MS SQL Server 2005.

реляционная база данных (Relation Database)

сервисы репликаций (Replication Services)

сервисы нотификаций (Notification Services)

сервисы интеграции (Integration Services)

аналитические сервисы (Analysis Services)

сервисы отчетов (Reporting Services)

инструменты управления - SQL Server

инструменты разработки - SQL Server

41) Укажите пользовательские компоненты OLAP.

аналитические сервисы (Analysis Services)

инструменты разработки - SQL Server

42) Укажите порядок проектирования ХД.

1.определение информационной структуры предприятия

2.выявление требований бизнес-аналитиков

3.проектирование и реализация схемы витрины данных

4.создание проекта интеграции витрины данных с существующими источниками информации

5.проектирование и развертывание многомерного куба для аналитической системы

6.разработка проекта анализа данных DataMining

43) Для проектирования ХД «Снизу вверх» использeтся:

инструмент SQL Server Management Studio

44) Для проектирования ХД «Сверху вниз»:

мастер Business Intelligence Development Studio

45) Собранный пакет SSIS можно сохранить:

в хранилище пакетов SSIS или в файловой системе

в виде файла

в виде переменной SQL Server

в базу данных (хранилище пакетов SSIS)

46) Задача SSIS, которая определяет и выполняет потоки данных, извлекает данные, применяет преобразования и загружает данные, называется:

задача Поток данных

47) Задачи SSIS, которые копируют файлы и директории, загружают файлы и данные, сохраняют данные, возвращенные при помощи веб-методов, или работают с XML-документами, называются:

задачи подготовки данных

48) Задачи, которые позволяют получить доступ, копировать, вставлять, удалять или изменять объекты или данные SQL Server, называются:

задачи SQL Server

49) Задачи, которые позволяют создать, изменить, удалить или обработать объекты служб Analysis Services, называются:

задачи служб Analysis Services

50) Задачи, которые расширяют функциональные возможности пакета посредством использования пользовательских сценариев, называются:

задачи сценариев

51) Задачи, которые выполняют административные функции: резервное копирование и сжатие баз данных SQL Server, восстановление и перестройка индексов, а также выполнение заданий агента SQL Server, называются:

задачи обслуживания

52) Задача "Поток данных" включает в себя:

подсистему обработки потока данных, перемещающую данные между источником и назначением и предоставляющую функции преобразования, очистки и изменения данных в процессе перемещения

53) Задача "Поток данных" может включать в себя несколько потоков данных: верно\неверно.

верно

54) Поток управления Integration Services может содержать следующие типы контейнеров:

контейнер «цикл по каждому элементу»

контейнер «цикл по элементам»

контейнер последовательности

55) Установите соответствие для стрелок ограничений очерёдности: Ограничения очередности задаются стрелками: зеленая стрелка – «выполнение по успеху», красная стрелка – «выполнение по ошибке»,синяя стрелка – «выполнение по завершению»

56) Поток данных может состоять из:

источников и назначений, извлекающих и загружающих данные, из преобразований, изменяющих и расширяющих данные, а также из путей, связывающих источники, преобразования и назначения.

57) Какие типы задач могут выполнять преобразования данных?

обновление, очистка, слияние и распространение данных и сбор статистики о них.

58) Какие выходы задачи "Поток данных" содержат выходные столбцы?

выходы ошибок и стандартные выходы

59) Компонент потока данных, который записывает данные из потока в указанное хранилище или создает набор данных в памяти, называется:

Целевой компонент потока данных

60) Входы, выходы и выходы ошибок в компонентах потока данных SSIS представляют собой:

Коллекции столбцов

61) Если задаче потока управления необходимо подключиться к базе данных или файловой системе, то в состав пакета SSIS обязательно должен входить компонент:

Диспетчер соединений

62) Группа мер OLAP это: набор показателей для которых определяется один набор измерений.

63) Мера (measure) в гиперкубе это:

численное значение(числовой показатель), выражающее определенный аспект деятельности организации

64) Гранулярность (степень, до которой можно детализировать) группы мер. Что это такое, чем она задаётся, чем она определяется? (нужно будет выбрать верное утверждение сложной конструкции)

самый низкий уровень иерархии отдельного измерения, связанный с отдельной группой мер, определяет гранулярность данной группы мер по данному измерению

65) Для создания вычисляемых мер OLAP используется язык: MDX

66) При использовании каких символов имя переменной MDX должно заключаться в квадратные [] скобки? ! @ # $ % & * () - + = / ? : ; « ‘ { } \ < >

67) Информация об агрегировании значений показателей находится (где?): в таблицах измерений куба (верно)

68) Многомерный гиперкуб может содержать (количество мер / измерений): одна, несколько, ...

    • меры,

  • измерения,

  • атрибуты,

  • иерархии.

69) Из каких таблиц витрины данных ХД загружаются значения мер в ячейки гиперкуба?

Таблиц фактов

70) Таблицы фактов витрины данных могут содержать:

Данные мер, фактические значения (меры)

71) В многомерном гиперкубе измерения соответствуют: осям куба (меры или показатели – индивидуальным ячейкам куба)

72) Иерархии в измерениях OLAP используются для:

  • определения порядка и возможности агрегации и детализации значений показателей

  • для организаций измерений в многоуровневые структуры.

  • Если меры определяют что хотят видеть аналитики, то измерения и иерархии определяют, как они это хотят видеть.

73) Количество уровней в сбалансированной иерархии:

определено её структурой и неизменно, и каждая ветвь иерархического дерева содержит объекты каждого из уровней.

74) Количество уровней в НЕ сбалансированной иерархии: может быть изменено, и каждая ветвь иерархического дерева может содержать объекты, принадлежащие не всем уровням, только нескольким первым.

75) Количество уровней в неровной иерархии: определено её структурой и постоянно, однако в отличие от сбалансированной иерархии некоторые ветви иерархического дерева могут не содержать объекты какого-либо уровня.