Добавил:
rushevamar@mail.ru Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

592_voprosa_ответы_на_экз_ситиод

.docx
Скачиваний:
11
Добавлен:
22.05.2022
Размер:
167.01 Кб
Скачать

Ключ, который заменяет естественный первичный ключ в хранилище данных

Правильный ответ: Суррогатный ключ

Ключ(и), который вы хотите использовать для таблиц измеренийs

Правильный ответ: суррогатные

Ключевые показатели эффективности (KPI) могут быть измерены в инструменте бизнес-аналитики. KPI могут

Правильный ответ: Внедрять улучшения и помогать компаниям сфокусировать своих людей и ресурсы на том, что важно.

Ключи и значения вывода из mapreduce обычно разделяются

Правильный ответ: Табом

Когда бизнес-аналитика ориентирована на внешнюю конкуренцию, это ________

Правильный ответ: Конкурентная бизнес-аналитика

Когда предоставляется информация о временных рядах, какой статистический метод лучше всего использовать для прогнозирования следующих шести месяцев?

Правильный ответ: Анализ тренда

Когда прямолинейный график с линейным уравнением Y /= a + bX, будет иметь наклон вверх

Правильный ответ: b > 0

Когда следует использовать непараметрический статистический метод?

Правильный ответ: знание основного распределения выборки ограничено

Кому принадлежит следующее требование необходимо понимать нужды бизнеса и переводить их в требования информационной системы?

Правильный ответ: Системный аналитик.

Копирование среди кластера HDFS по distcp по протоколу hdfs требует, чтобы кластер имел

Правильный ответ: Одинаковую версию Hadoop

Копирование среди кластера HDFS по distcp с использованием протокола hdfs требует, чтобы кластер имел

Правильный ответ: Одинаковую версию Hadoop

Корпоративные хранилища данных это

Правильный ответ: централизованное хранилище подробных данных из всех соответствующих систем источников данных

Кто управляет каждой слейв нодой (зависимым узлом) в Yarn?

Правильный ответ: Node Manager

Кто управляет каждым подчиненным узлом в Yarn

Правильный ответ: Node Manager

Кубы данных создаются путем извлечения данных из оперативной базы данных или из ________

Правильный ответ: хранилища данных

Лучше избегать метрики кривой ROC, поскольку она может страдать от парадокса точности.

Правильный ответ: Ложь

Метаданные файловой системы хранятся в

Правильный ответ: Namenode

Метрики собираются

Правильный ответ: демоном Hadoop

Минимальный коэффициент репликации по умолчанию

Правильный ответ: 3

Многие функции интерфейса OLAP «заимствованы» из предыдущих

поколений инструментов ____ данных.

Правильный ответ: анализа

Многомерность и поддержка принятия решений являются ключевыми характеристиками хранилища данных.

Правильный ответ: Да.

Многомерный анализ использует различные инструменты искусственного интеллекта (например, нейронные сети и нечёткая логика), чтобы сформировать основу для поиска информации и построения бизнес-аналитики в OLAP.

Правильный ответ: Нет.

Моделирование используется для создания модели данных, которая помогает в дальнейшем определить информационные требования

Правильный ответ: Ложь

Может ли пользователь выполнять задачи ввода или редактирования данных OLAP?

Правильный ответ: Не может.

Можно использовать одно измерение в нескольких схемах

Правильный ответ: Верно

На какой платформе работает Hadoop?

Правильный ответ: Cross-platform

На какой фазе жизненного цикла BI эксперты завершают этап интеграции решения Business Intelligence и настраивают его так, чтобы он мог заменить существующую систему или работать параллельно с существующей системой

Правильный ответ: Реализация

На какой фазе жизненного цикла BI эксперты завершают этап интеграции решения Business Intelligence и настраивают его так, чтобы он мог заменить существующую систему или работать параллельно с существующей системой

Правильный ответ: Реализация

На каком языке написана Cassandra?

Правильный ответ: Java

На каком языке программирования написан Hadoop?

Правильный ответ: Java

На какую из следующих областей влияет BI

Правильный ответ: Все варианты ответов верны

На какую из следующих областей влияет BI?

Правильный ответ: Все упомянутое

На этапе ____, интеллектуального анализа данных, основные наборы данных, которые будут использоваться операцией интеллектуального анализа данных, идентифицируются и очищаются от любых примесей данных.

Правильный ответ: подготовки

Назовите другое / другие существующее название для куба OLAP.

Правильный ответ: Все варианты верны

Наивный байесовский классификатор используется для

Правильный ответ: Генерация моделей майнинга

Наивный байесовский классификатор используется для

Правильный ответ: Генерация моделей майнинга

Ниже приведены примеры использования больших данных в здравоохранении. Какой вариант не подходит?

Правильный ответ: Доступ к приватным данным пациента

Нужно ли разработчикам обеспечивать требование безопасности при использовании баз данных NoSQL?

Правильный ответ: Да.

Обобщением матричного отчета, которое представлено визуально, является ____________, который также называется кубом данных.

Правильный ответ: Двумерный куб.

Обучение, которое использует маркированные наборы данных, которые состоят из входных данных и ожидаемых результатов

Правильный ответ: Контролируемое обучение

Оператор ______________ используется для просмотра карты сокращения планов выполнения.

Правильный ответ: EXPLAIN

Оператор _______________ используется для просмотра схемы отношения в Pig.

Правильный ответ: Describe

Операционные базы данных

Правильный ответ: Ничего из вышеперечисленного

Операционные базы данных часто связывают с

Правильный ответ: обработкой транзакций OLTP онлайн

Операция _________________ OLAP обеспечивает альтернативное представление данных, вращая их.

Правильный ответ: Pivot.

Операция Dice также известна, как операция вращения.

Правильный ответ: Неверно.

Операция перехода от данных с более мелкой гранулярностью к более крупной гранулярности (посредством агрегации) называется _________

Правильный ответ: Rollup

Операция перехода от данных с большим уровнем детализации к данным с меньшим уровнем детализации (посредством агрегации) называется

Правильный ответ: Свертывание (Roll-up).

Откуда приложения BI загружают данные?

Правильный ответ: Хранилище данных и дата-центры.

Периодические данные - это данные, которые физически изменяются после добавления в хранилище

Правильный ответ: Не верно

Планирование данных, спецификация требований, конструирование (физическое, логическое, концептуальное) – шаги разработки базы данных, расположенные в правильном порядке.

Правильный ответ: Да.

Платформа больших данных состоит из _______________.

Правильный ответ: Всего вышеперечисленного

По мере того как компании переходят с экспериментального этапа с Hadoop, многие ссылаются на необходимость дополнительных возможностей, в том числе:

Правильный ответ: Повышение безопасности, менеджмента нагрузки и поддержки SQL

По мере того, как компании переходят с экспериментального этапа с Hadoop, многие ссылаются на необходимость дополнительных возможностей, в том числе _______________

Правильный ответ: Улучшенная безопасность, управление рабочей нагрузкой и поддержка SQL

По мнению аналитиков, на чем могут основываться традиционные ИТ-системы, когда они интегрированы с такими технологиями больших данных, как Hadoop?

Правильный ответ: Управление большими данными и добыча данных

Под какой лицензией распространяется Apache Hadoop?

Правильный ответ: Apache License 2.0

Поскольку куб данных предопределен с заданным числом измерений, добавление нового измерения требует ____.

Правильный ответ: повторного создания куба данных

После чего следует определять источники данных в процессе внедрения хранилища данных?

Правильный ответ: После того, как определены потребности пользователей

Постройте следующую последовательность: 1.Данные 2.Знания 3.Информация 4.Осмотр

Правильный ответ: 1,3,2,4

Почему стоит провести интеллектуальный анализ операций?

Правильный ответ: Для улучшения принятия решений и достижения лучших результатов в бизнесе.

Предел данных для хранения в znode в zookeeper

Правильный ответ: 1 MB

Предположим, что вы хотите проводить обучение под наблюдением и прогнозировать количество новорожденных в соответствии с численностью популяции аистов, это пример ...

Правильный ответ: Регрессии

Преимущества использования BI для продаж включают в себя следующее

Правильный ответ: Все вышеперечисленные.

Приборная панель BI не дает

Правильный ответ: Скорость, с которой вы ездите на машине.

Проблема поиска скрытой структуры в немаркированных данных называется ...

Правильный ответ: Неконтролируемое обучение

Проблемы интерпретации вычислительной сложности

Правильный ответ: Ограничения кластерного анализа и правила ассоциации

Прозрачность распределения связана с типом БД

Правильный ответ: распределенная

Производные данные - это подробные текущие данные, которые должны быть едиными, достоверными данными для всех приложений поддержки принятия решений.

Правильный ответ: Не верно

Процесс выбора прямоугольного подмножества куба путем выбора одного значения для одного из его измерений и создания нового куба с одним меньшим размером это — _________

Правильный ответ: Slice

Процесс изучения данных, доступных в существующем источнике данных и сбора статистики и информации о данных

Правильный ответ: Data Profiling

Процесс обработки данных о клиентах и их отношениях с предприятием с целью улучшения продаж, обслуживания предприятия, снижения затрат.

Правильный ответ: CRM аналитика

Процесс просмотра кросс-таблицы (одномерной) с фиксированным значением одного атрибута называется ________

Правильный ответ: Pivoting

Процесс просмотра матричного отчета (одномерного) с фиксированным значением одного атрибута:

Правильный ответ: Срез (Slice).

Различать спам и нежелательные письма - это задача классификации, верно или нет?

Правильный ответ: Правда

Расположение каждого значения данных в кубе, является функцией осей x, y и z в ____ пространстве.

Правильный ответ: трехмерном

Расположите в правильном порядке шаги для создания куба данных:

1. Выбрать источник данных.

2. Создать запрос, который извлекает данные из базы данных.

3. Создать куб из извлеченных данных.

Правильный ответ: 1,2,3.

Расположите следующее 1. Подготовка данных 2. Устойчивая подгтовка 3. Подгтовка истории 4. ODS 5. Хранилище данных 6. Datamart

Правильный ответ: 1,3,2,4,5,6

Расположите следующее 1.Уровень представления 2.ODS уровень 3.Уровень реплики 4.DWH уровень

Правильный ответ: 3,2,4,1

Расположите следующие шаги в правильной последовательности. 1. Найдите необходимые транзакции. 2. Проверьте, является ли факт измерением. 3. Проверьте, является ли измерение фактом. 4. Определите ключевые измерения.

Правильный ответ: 1,4,2,3

Распределение позволяет пользователю игнорировать

Правильный ответ: расположение данных, фрагментацию данных, репликацию данных

Распределенная база данных

Правильный ответ: не полностью хранится в одном центральном местоположении, а распределена по сети сайтов, которые географически разделены и связаны сетевыми системами

Расшифровка аббревиатуры ODS

Правильный ответ: Operational data storage

Регион в Hbase относится к

Правильный ответ: Горизонтальному разделению

Регион в Hbase относится к

Правильный ответ: Горизонтальному разделению

Результат запроса OLAP отображается в виде …

Правильный ответ: В виде матрицы или в свободном формате.

Репликация данных это

Правильный ответ: хранение копий данных на нескольких сайтах, обслуживаемых компьютерной сетью

Роль бизнес-аналитики в организации может заключаться в том, чтобы помочь определить эффективность различных рекламных кампаний по демографическим группам, сегментированным по местоположению.

Правильный ответ: Да.

С какими данными может работать Hadoop?

Правильный ответ: Всё вышеперечисленное

С помощью какой технологии может быть достигнуто сегментирование базы данных по нескольким серверам?

Правильный ответ: SAN (Storage Area Network).

Самоорганизующиеся карты - пример ...

Правильный ответ: Отсутствия понятных данных

Сервер базы данных клиент-серверной архитектуры

Правильный ответ: обрабатывает запросы и запросы на обновление со стороны приложения

Систематический многомерный анализ данных

Правильный ответ: Определение of Online Analytical Processing (OLAP)

Системы OLAP обеспечивают разложение(_______) и возможности консолидации(roll-up).

Правильный ответ: drill-down

Сколько клеток в кубе айсберга, если в каждом измерении ровно две

отдельные значения и только базовый кубоид не удовлетворяет условию айсберга?

Правильный ответ: 3n-2n

Сколько кубоидов имеет n-мерный куб, если каждое измерение имеет 2

Иерархии?

Правильный ответ: 3n

Сколько кубоидов имеет n-мерный куб?

Правильный ответ: 2n

Сколько обычно потоков копиров, используемых задачей сокращения для извлечения выходных данных карты?

Правильный ответ: 5.0

Сколько ячеек имеет n-мерный куб, если каждое измерение имеет

точно два разных значения?

Правильный ответ: 3n

Следует ли всегда выбирать NoSQL, не оценивая требования проекта?

Правильный ответ: Нет.

Соединение DataNode с NameNode выполняется путем добавления их данных в

Правильный ответ: Include file

Список различных типов серверов OLAP?

Правильный ответ: Все варианты ответа верны

Статическое извлечение используется для текущей поддержки хранилища

Правильный ответ: Не верно

Суммирование - это простое сложение значений в одном или нескольких измерениях данных.

Правильный ответ: Правда

Существует несколько драйверов для случая использования анализа операций. В чем причина того, что компании часто не могут использовать машинные данные в их необработанном формате?

Правильный ответ: Всё вышеперечисленное

Схема "Звезда" это

Правильный ответ: техника моделирования данных, используемая для отображения многомерного анализа данных в схему "Звезда"

Схема «звезда» обычно подходит для оперативной обработки транзакций и поэтому обычно используется в операционных системах, хранилищах операционных данных и EDW

Правильный ответ: Не верно

Схема «Звезда» хранит данные в форме

Правильный ответ: 2NF

Считается ли Hadoop базой данных NoSQL?

Правильный ответ: Нет.

Таблицы размеров это

Правильный ответ: описательные данные о субъектах бизнеса (измерения)

Таблицы фактов нормализованы

Правильный ответ: Верно

Таблицы фактов представляют

Правильный ответ: конкретные деловые аспекты или деятельность

Предыдущая страница

Такой результат может быть достигнут путем использования:

Правильный ответ: Ни один из вышеупомянутых.

Тип данных ключа для TextInputFormat ссылается на

Правильный ответ: Смещение байтов

Тип таблицы общих измерений в схемах типа "звезда"

Правильный ответ: временная

Типы схем в DWH

Правильный ответ: «Звезда», «Снежинка»

Транснациональное зерно

Правильный ответ: наиболее детальный уровень детализации

Три уровня архитектуры расширенного хранилища данных (т.е. уровень NCR 3)

Правильный ответ: источники оперативных данных, корпоративное хранилище данных и витрина данных

У нас есть данные Market Basket для 1000 арендных транзакций в видеомагазине. Есть для проката видео - A, B, C, D. Вероятность того, что видео C и видео D арендуются одновременно, называется ________.

Правильный ответ: Поддержка

Удаление данных из хранилища данных называется __

Правильный ответ: Очистка данных

Укажите на неверное утверждение.

Правильный ответ: В нереляционных базах данных перед добавлением данных необходимо определить связи.

Укажите неверное утверждение

Правильный ответ: BI - это категория программного обеспечения для баз данных, которая предоставляет интерфейс, который помогает пользователям быстро и в интерактивном режиме анализировать результаты в различных измерениях данных.

Укажите неверное утверждение.

Правильный ответ: BI - это категория программного обеспечения для баз данных, которая предоставляет интерфейс, который помогает пользователям быстро и в интерактивном режиме анализировать результаты в различных измерениях данных.

Укажите неверное утверждение.

Правильный ответ: Модель программирования MapReduce, используемая Hadoop, сложно написать и протестировать

Укажите правильное утверждение

Правильный ответ: Бизнес-аналитика позволяет предприятиям получать бизнес-преимущества от данных

Укажите правильное утверждение.

Правильный ответ: Бизнес-аналитика дает предприятиям возможность извлекать выгоду из данных.

Укажите правильное утверждение.

Правильный ответ: Hadoop 2.0 позволяет обрабатывать данные в реальном времени

Укажите правильное утверждение.

Правильный ответ: Всё перечисленное.

Уровень представления клиент-серверной архитектуры

Правильный ответ: обеспечивает интерфейс пользователя и взаимодействует с пользователями

Условный отчет основывается на собранных данных, которые затем анализируются во время генерации отчета, в котором сообщается о результатах анализа в выходных данных отчета

Правильный ответ: Верно

Файл архива в Hadoop имеет расширение?

Правильный ответ: har

Формат для файла конфигурации, перечисляющий вторичные NameNode, является

Правильный ответ: Text

Фрагментация данных позволяет нам

Правильный ответ: разбить один объект на два или более фрагментов

Функциональные возможности OLAP?.

Правильный ответ: Свёртывание(roll-up), Детализация(drill-down), Срезы(slicing and dicing), Поворот(pivot)

Хороший ETL-инструмент должен быть в состоянии общаться со многими

Правильный ответ: Источниками

Хранилище данных - это технология BI для

Правильный ответ: правильной интеграции и управление данными из различных источников и ответов на вопросы о принятии решений в бизнесе, которые ранее были невозможны

Хранилище данных должно быть денормализованно

Правильный ответ: Верно

Хранилище данных и OLAP являются двумя взаимосвязанными и взаимодополняющими ____.

Правильный ответ: средами

Хранилище данных и OLAP являются двумя взаимосвязанными и взаимодополняющими ____.

Правильный ответ: средами

Хранилище данных это

Правильный ответ: интегрированная, предметно-ориентированная, изменяющаяся во времени, энергонезависимая база данных, поддерживающая бизнес-аналитику

Централизованная система баз данных

Правильный ответ: архитектурное решение, при котором СУБД и база данных физически расположены в одном месте

Чем бизнес-аналитика помогает опытным работникам

Правильный ответ: Все вышеперечисленное

Что включает в себя типичная среда бизнес-аналитики?

Правильный ответ: Всё перечисленное.

Что вычисляет MSE в машинном обучении

Правильный ответ: Ошибку

Что делает отображение бизнес-процессов для проектирования модуля ERP достижимым?

Правильный ответ: Все вышеперечисленное.

Что делает поставщик услуг приложений

Правильный ответ: Предоставляет программное обеспечение через интернет

Что есть Business Intelligence?

Правильные ответы: Процесс, Инструмент, Техника

Что занимает больше размера?

Правильный ответ: Полная материализация куба

Что из ниже перечисленного является верным утверждением для трехуровневого хранилища данных?

Правильный ответ: После создания витрины данных, пользователи будут напрямую получать новые данные из оперативных баз данных.

Что из нижеперечисленного ложно о Hadoop?

Правильный ответ: Главный алгоритм использует MapReduce

Что из нижеперечисленного моделирование данных?

Правильный ответ: OLAP

Что из нижеперечисленного может потребовать анализа данных из прошлого или настоящего, или заглянуть в будущие прогнозы

Правильный ответ: Запрос

Что из нижеперечисленного не соответствует свойствам NoSQL?

Правильный ответ: Низкая масштабируемость.

Что из нижеперечисленного НЕ соответствует хранилищу данных

Правильный ответ: Изменяемость

Что из нижеперечисленного не является источником данных для ETL?

Правильный ответ: SJT

Что из нижеперечисленного ниже обычно использует методы интеллектуального анализа данных?

Правильный ответ: Все вышеперечисленное

Что из нижеперечисленного обозначает копирование одних и тех же данных?

Правильный ответ: Репликация

Что из нижеперечисленного поддерживает все Hive DDL, для которых не требуется выполнение MapReduce?

Правильный ответ: HCatalog CLI

Что из нижеперечисленного поможет удовлетворить изменяющиеся требования к анализу отчетов конечного пользователя

Правильный ответ: Предоставление конечным пользователям возможность создавать свои собственные отчеты

Что из нижеперечисленного является демоном Hadoop’a?

Правильный ответ: Все вышеперечисленные

Что из нижеперечисленного является отношением?

Правильный ответ: связь между сущностями

Что из нижеперечисленного является проблемой с ресурсами данных?

Правильный ответ: Всё вышеперечисленное

Что из перечисленного не входит в главные преимущества NoSQL для организаций?

Правильный ответ: Поддержка согласованности данных.

Что из перечисленного не обеспечивает работу с NoSQL?

Правильный ответ: PostgreSQL.

Что из перечисленного не связано с интеллектуальным анализом данных?

Правильный ответ: Преобразование данных

Предыдущая страница

Что из перечисленного не является базой данных NoSQL?

Правильный ответ: SQL Server.

Что из перечисленного не является командой Hive DDL

Правильный ответ: Ничего из этого

Что из перечисленного не является компонентом хранилища данных?