592_voprosa_ответы_на_экз_ситиод
.docx
Ключ, который заменяет естественный первичный ключ в хранилище данных
Правильный ответ: Суррогатный ключ
Ключ(и), который вы хотите использовать для таблиц измеренийs
Правильный ответ: суррогатные
Ключевые показатели эффективности (KPI) могут быть измерены в инструменте бизнес-аналитики. KPI могут
Правильный ответ: Внедрять улучшения и помогать компаниям сфокусировать своих людей и ресурсы на том, что важно.
Ключи и значения вывода из mapreduce обычно разделяются
Правильный ответ: Табом
Когда бизнес-аналитика ориентирована на внешнюю конкуренцию, это ________
Правильный ответ: Конкурентная бизнес-аналитика
Когда предоставляется информация о временных рядах, какой статистический метод лучше всего использовать для прогнозирования следующих шести месяцев?
Правильный ответ: Анализ тренда
Когда прямолинейный график с линейным уравнением Y /= a + bX, будет иметь наклон вверх
Правильный ответ: b > 0
Когда следует использовать непараметрический статистический метод?
Правильный ответ: знание основного распределения выборки ограничено
Кому принадлежит следующее требование необходимо понимать нужды бизнеса и переводить их в требования информационной системы?
Правильный ответ: Системный аналитик.
Копирование среди кластера HDFS по distcp по протоколу hdfs требует, чтобы кластер имел
Правильный ответ: Одинаковую версию Hadoop
Копирование среди кластера HDFS по distcp с использованием протокола hdfs требует, чтобы кластер имел
Правильный ответ: Одинаковую версию Hadoop
Корпоративные хранилища данных это
Правильный ответ: централизованное хранилище подробных данных из всех соответствующих систем источников данных
Кто управляет каждой слейв нодой (зависимым узлом) в Yarn?
Правильный ответ: Node Manager
Кто управляет каждым подчиненным узлом в Yarn
Правильный ответ: Node Manager
Кубы данных создаются путем извлечения данных из оперативной базы данных или из ________
Правильный ответ: хранилища данных
Лучше избегать метрики кривой ROC, поскольку она может страдать от парадокса точности.
Правильный ответ: Ложь
Метаданные файловой системы хранятся в
Правильный ответ: Namenode
Метрики собираются
Правильный ответ: демоном Hadoop
Минимальный коэффициент репликации по умолчанию
Правильный ответ: 3
Многие функции интерфейса OLAP «заимствованы» из предыдущих
поколений инструментов ____ данных.
Правильный ответ: анализа
Многомерность и поддержка принятия решений являются ключевыми характеристиками хранилища данных.
Правильный ответ: Да.
Многомерный анализ использует различные инструменты искусственного интеллекта (например, нейронные сети и нечёткая логика), чтобы сформировать основу для поиска информации и построения бизнес-аналитики в OLAP.
Правильный ответ: Нет.
Моделирование используется для создания модели данных, которая помогает в дальнейшем определить информационные требования
Правильный ответ: Ложь
Может ли пользователь выполнять задачи ввода или редактирования данных OLAP?
Правильный ответ: Не может.
Можно использовать одно измерение в нескольких схемах
Правильный ответ: Верно
На какой платформе работает Hadoop?
Правильный ответ: Cross-platform
На какой фазе жизненного цикла BI эксперты завершают этап интеграции решения Business Intelligence и настраивают его так, чтобы он мог заменить существующую систему или работать параллельно с существующей системой
Правильный ответ: Реализация
На какой фазе жизненного цикла BI эксперты завершают этап интеграции решения Business Intelligence и настраивают его так, чтобы он мог заменить существующую систему или работать параллельно с существующей системой
Правильный ответ: Реализация
На каком языке написана Cassandra?
Правильный ответ: Java
На каком языке программирования написан Hadoop?
Правильный ответ: Java
На какую из следующих областей влияет BI
Правильный ответ: Все варианты ответов верны
На какую из следующих областей влияет BI?
Правильный ответ: Все упомянутое
На этапе ____, интеллектуального анализа данных, основные наборы данных, которые будут использоваться операцией интеллектуального анализа данных, идентифицируются и очищаются от любых примесей данных.
Правильный ответ: подготовки
Назовите другое / другие существующее название для куба OLAP.
Правильный ответ: Все варианты верны
Наивный байесовский классификатор используется для
Правильный ответ: Генерация моделей майнинга
Наивный байесовский классификатор используется для
Правильный ответ: Генерация моделей майнинга
Ниже приведены примеры использования больших данных в здравоохранении. Какой вариант не подходит?
Правильный ответ: Доступ к приватным данным пациента
Нужно ли разработчикам обеспечивать требование безопасности при использовании баз данных NoSQL?
Правильный ответ: Да.
Обобщением матричного отчета, которое представлено визуально, является ____________, который также называется кубом данных.
Правильный ответ: Двумерный куб.
Обучение, которое использует маркированные наборы данных, которые состоят из входных данных и ожидаемых результатов
Правильный ответ: Контролируемое обучение
Оператор ______________ используется для просмотра карты сокращения планов выполнения.
Правильный ответ: EXPLAIN
Оператор _______________ используется для просмотра схемы отношения в Pig.
Правильный ответ: Describe
Операционные базы данных
Правильный ответ: Ничего из вышеперечисленного
Операционные базы данных часто связывают с
Правильный ответ: обработкой транзакций OLTP онлайн
Операция _________________ OLAP обеспечивает альтернативное представление данных, вращая их.
Правильный ответ: Pivot.
Операция Dice также известна, как операция вращения.
Правильный ответ: Неверно.
Операция перехода от данных с более мелкой гранулярностью к более крупной гранулярности (посредством агрегации) называется _________
Правильный ответ: Rollup
Операция перехода от данных с большим уровнем детализации к данным с меньшим уровнем детализации (посредством агрегации) называется
Правильный ответ: Свертывание (Roll-up).
Откуда приложения BI загружают данные?
Правильный ответ: Хранилище данных и дата-центры.
Периодические данные - это данные, которые физически изменяются после добавления в хранилище
Правильный ответ: Не верно
Планирование данных, спецификация требований, конструирование (физическое, логическое, концептуальное) – шаги разработки базы данных, расположенные в правильном порядке.
Правильный ответ: Да.
Платформа больших данных состоит из _______________.
Правильный ответ: Всего вышеперечисленного
По мере того как компании переходят с экспериментального этапа с Hadoop, многие ссылаются на необходимость дополнительных возможностей, в том числе:
Правильный ответ: Повышение безопасности, менеджмента нагрузки и поддержки SQL
По мере того, как компании переходят с экспериментального этапа с Hadoop, многие ссылаются на необходимость дополнительных возможностей, в том числе _______________
Правильный ответ: Улучшенная безопасность, управление рабочей нагрузкой и поддержка SQL
По мнению аналитиков, на чем могут основываться традиционные ИТ-системы, когда они интегрированы с такими технологиями больших данных, как Hadoop?
Правильный ответ: Управление большими данными и добыча данных
Под какой лицензией распространяется Apache Hadoop?
Правильный ответ: Apache License 2.0
Поскольку куб данных предопределен с заданным числом измерений, добавление нового измерения требует ____.
Правильный ответ: повторного создания куба данных
После чего следует определять источники данных в процессе внедрения хранилища данных?
Правильный ответ: После того, как определены потребности пользователей
Постройте следующую последовательность: 1.Данные 2.Знания 3.Информация 4.Осмотр
Правильный ответ: 1,3,2,4
Почему стоит провести интеллектуальный анализ операций?
Правильный ответ: Для улучшения принятия решений и достижения лучших результатов в бизнесе.
Предел данных для хранения в znode в zookeeper
Правильный ответ: 1 MB
Предположим, что вы хотите проводить обучение под наблюдением и прогнозировать количество новорожденных в соответствии с численностью популяции аистов, это пример ...
Правильный ответ: Регрессии
Преимущества использования BI для продаж включают в себя следующее
Правильный ответ: Все вышеперечисленные.
Приборная панель BI не дает
Правильный ответ: Скорость, с которой вы ездите на машине.
Проблема поиска скрытой структуры в немаркированных данных называется ...
Правильный ответ: Неконтролируемое обучение
Проблемы интерпретации вычислительной сложности
Правильный ответ: Ограничения кластерного анализа и правила ассоциации
Прозрачность распределения связана с типом БД
Правильный ответ: распределенная
Производные данные - это подробные текущие данные, которые должны быть едиными, достоверными данными для всех приложений поддержки принятия решений.
Правильный ответ: Не верно
Процесс выбора прямоугольного подмножества куба путем выбора одного значения для одного из его измерений и создания нового куба с одним меньшим размером это — _________
Правильный ответ: Slice
Процесс изучения данных, доступных в существующем источнике данных и сбора статистики и информации о данных
Правильный ответ: Data Profiling
Процесс обработки данных о клиентах и их отношениях с предприятием с целью улучшения продаж, обслуживания предприятия, снижения затрат.
Правильный ответ: CRM аналитика
Процесс просмотра кросс-таблицы (одномерной) с фиксированным значением одного атрибута называется ________
Правильный ответ: Pivoting
Процесс просмотра матричного отчета (одномерного) с фиксированным значением одного атрибута:
Правильный ответ: Срез (Slice).
Различать спам и нежелательные письма - это задача классификации, верно или нет?
Правильный ответ: Правда
Расположение каждого значения данных в кубе, является функцией осей x, y и z в ____ пространстве.
Правильный ответ: трехмерном
Расположите в правильном порядке шаги для создания куба данных:
1. Выбрать источник данных.
2. Создать запрос, который извлекает данные из базы данных.
3. Создать куб из извлеченных данных.
Правильный ответ: 1,2,3.
Расположите следующее 1. Подготовка данных 2. Устойчивая подгтовка 3. Подгтовка истории 4. ODS 5. Хранилище данных 6. Datamart
Правильный ответ: 1,3,2,4,5,6
Расположите следующее 1.Уровень представления 2.ODS уровень 3.Уровень реплики 4.DWH уровень
Правильный ответ: 3,2,4,1
Расположите следующие шаги в правильной последовательности. 1. Найдите необходимые транзакции. 2. Проверьте, является ли факт измерением. 3. Проверьте, является ли измерение фактом. 4. Определите ключевые измерения.
Правильный ответ: 1,4,2,3
Распределение позволяет пользователю игнорировать
Правильный ответ: расположение данных, фрагментацию данных, репликацию данных
Распределенная база данных
Правильный ответ: не полностью хранится в одном центральном местоположении, а распределена по сети сайтов, которые географически разделены и связаны сетевыми системами
Расшифровка аббревиатуры ODS
Правильный ответ: Operational data storage
Регион в Hbase относится к
Правильный ответ: Горизонтальному разделению
Регион в Hbase относится к
Правильный ответ: Горизонтальному разделению
Результат запроса OLAP отображается в виде …
Правильный ответ: В виде матрицы или в свободном формате.
Репликация данных это
Правильный ответ: хранение копий данных на нескольких сайтах, обслуживаемых компьютерной сетью
Роль бизнес-аналитики в организации может заключаться в том, чтобы помочь определить эффективность различных рекламных кампаний по демографическим группам, сегментированным по местоположению.
Правильный ответ: Да.
С какими данными может работать Hadoop?
Правильный ответ: Всё вышеперечисленное
С помощью какой технологии может быть достигнуто сегментирование базы данных по нескольким серверам?
Правильный ответ: SAN (Storage Area Network).
Самоорганизующиеся карты - пример ...
Правильный ответ: Отсутствия понятных данных
Сервер базы данных клиент-серверной архитектуры
Правильный ответ: обрабатывает запросы и запросы на обновление со стороны приложения
Систематический многомерный анализ данных
Правильный ответ: Определение of Online Analytical Processing (OLAP)
Системы OLAP обеспечивают разложение(_______) и возможности консолидации(roll-up).
Правильный ответ: drill-down
Сколько клеток в кубе айсберга, если в каждом измерении ровно две
отдельные значения и только базовый кубоид не удовлетворяет условию айсберга?
Правильный ответ: 3n-2n
Сколько кубоидов имеет n-мерный куб, если каждое измерение имеет 2
Иерархии?
Правильный ответ: 3n
Сколько кубоидов имеет n-мерный куб?
Правильный ответ: 2n
Сколько обычно потоков копиров, используемых задачей сокращения для извлечения выходных данных карты?
Правильный ответ: 5.0
Сколько ячеек имеет n-мерный куб, если каждое измерение имеет
точно два разных значения?
Правильный ответ: 3n
Следует ли всегда выбирать NoSQL, не оценивая требования проекта?
Правильный ответ: Нет.
Соединение DataNode с NameNode выполняется путем добавления их данных в
Правильный ответ: Include file
Список различных типов серверов OLAP?
Правильный ответ: Все варианты ответа верны
Статическое извлечение используется для текущей поддержки хранилища
Правильный ответ: Не верно
Суммирование - это простое сложение значений в одном или нескольких измерениях данных.
Правильный ответ: Правда
Существует несколько драйверов для случая использования анализа операций. В чем причина того, что компании часто не могут использовать машинные данные в их необработанном формате?
Правильный ответ: Всё вышеперечисленное
Схема "Звезда" это
Правильный ответ: техника моделирования данных, используемая для отображения многомерного анализа данных в схему "Звезда"
Схема «звезда» обычно подходит для оперативной обработки транзакций и поэтому обычно используется в операционных системах, хранилищах операционных данных и EDW
Правильный ответ: Не верно
Схема «Звезда» хранит данные в форме
Правильный ответ: 2NF
Считается ли Hadoop базой данных NoSQL?
Правильный ответ: Нет.
Таблицы размеров это
Правильный ответ: описательные данные о субъектах бизнеса (измерения)
Таблицы фактов нормализованы
Правильный ответ: Верно
Таблицы фактов представляют
Правильный ответ: конкретные деловые аспекты или деятельность
Предыдущая страница
Такой результат может быть достигнут путем использования:
Правильный ответ: Ни один из вышеупомянутых.
Тип данных ключа для TextInputFormat ссылается на
Правильный ответ: Смещение байтов
Тип таблицы общих измерений в схемах типа "звезда"
Правильный ответ: временная
Типы схем в DWH
Правильный ответ: «Звезда», «Снежинка»
Транснациональное зерно
Правильный ответ: наиболее детальный уровень детализации
Три уровня архитектуры расширенного хранилища данных (т.е. уровень NCR 3)
Правильный ответ: источники оперативных данных, корпоративное хранилище данных и витрина данных
У нас есть данные Market Basket для 1000 арендных транзакций в видеомагазине. Есть для проката видео - A, B, C, D. Вероятность того, что видео C и видео D арендуются одновременно, называется ________.
Правильный ответ: Поддержка
Удаление данных из хранилища данных называется __
Правильный ответ: Очистка данных
Укажите на неверное утверждение.
Правильный ответ: В нереляционных базах данных перед добавлением данных необходимо определить связи.
Укажите неверное утверждение
Правильный ответ: BI - это категория программного обеспечения для баз данных, которая предоставляет интерфейс, который помогает пользователям быстро и в интерактивном режиме анализировать результаты в различных измерениях данных.
Укажите неверное утверждение.
Правильный ответ: BI - это категория программного обеспечения для баз данных, которая предоставляет интерфейс, который помогает пользователям быстро и в интерактивном режиме анализировать результаты в различных измерениях данных.
Укажите неверное утверждение.
Правильный ответ: Модель программирования MapReduce, используемая Hadoop, сложно написать и протестировать
Укажите правильное утверждение
Правильный ответ: Бизнес-аналитика позволяет предприятиям получать бизнес-преимущества от данных
Укажите правильное утверждение.
Правильный ответ: Бизнес-аналитика дает предприятиям возможность извлекать выгоду из данных.
Укажите правильное утверждение.
Правильный ответ: Hadoop 2.0 позволяет обрабатывать данные в реальном времени
Укажите правильное утверждение.
Правильный ответ: Всё перечисленное.
Уровень представления клиент-серверной архитектуры
Правильный ответ: обеспечивает интерфейс пользователя и взаимодействует с пользователями
Условный отчет основывается на собранных данных, которые затем анализируются во время генерации отчета, в котором сообщается о результатах анализа в выходных данных отчета
Правильный ответ: Верно
Файл архива в Hadoop имеет расширение?
Правильный ответ: har
Формат для файла конфигурации, перечисляющий вторичные NameNode, является
Правильный ответ: Text
Фрагментация данных позволяет нам
Правильный ответ: разбить один объект на два или более фрагментов
Функциональные возможности OLAP?.
Правильный ответ: Свёртывание(roll-up), Детализация(drill-down), Срезы(slicing and dicing), Поворот(pivot)
Хороший ETL-инструмент должен быть в состоянии общаться со многими
Правильный ответ: Источниками
Хранилище данных - это технология BI для
Правильный ответ: правильной интеграции и управление данными из различных источников и ответов на вопросы о принятии решений в бизнесе, которые ранее были невозможны
Хранилище данных должно быть денормализованно
Правильный ответ: Верно
Хранилище данных и OLAP являются двумя взаимосвязанными и взаимодополняющими ____.
Правильный ответ: средами
Хранилище данных и OLAP являются двумя взаимосвязанными и взаимодополняющими ____.
Правильный ответ: средами
Хранилище данных это
Правильный ответ: интегрированная, предметно-ориентированная, изменяющаяся во времени, энергонезависимая база данных, поддерживающая бизнес-аналитику
Централизованная система баз данных
Правильный ответ: архитектурное решение, при котором СУБД и база данных физически расположены в одном месте
Чем бизнес-аналитика помогает опытным работникам
Правильный ответ: Все вышеперечисленное
Что включает в себя типичная среда бизнес-аналитики?
Правильный ответ: Всё перечисленное.
Что вычисляет MSE в машинном обучении
Правильный ответ: Ошибку
Что делает отображение бизнес-процессов для проектирования модуля ERP достижимым?
Правильный ответ: Все вышеперечисленное.
Что делает поставщик услуг приложений
Правильный ответ: Предоставляет программное обеспечение через интернет
Что есть Business Intelligence?
Правильные ответы: Процесс, Инструмент, Техника
Что занимает больше размера?
Правильный ответ: Полная материализация куба
Что из ниже перечисленного является верным утверждением для трехуровневого хранилища данных?
Правильный ответ: После создания витрины данных, пользователи будут напрямую получать новые данные из оперативных баз данных.
Что из нижеперечисленного ложно о Hadoop?
Правильный ответ: Главный алгоритм использует MapReduce
Что из нижеперечисленного моделирование данных?
Правильный ответ: OLAP
Что из нижеперечисленного может потребовать анализа данных из прошлого или настоящего, или заглянуть в будущие прогнозы
Правильный ответ: Запрос
Что из нижеперечисленного не соответствует свойствам NoSQL?
Правильный ответ: Низкая масштабируемость.
Что из нижеперечисленного НЕ соответствует хранилищу данных
Правильный ответ: Изменяемость
Что из нижеперечисленного не является источником данных для ETL?
Правильный ответ: SJT
Что из нижеперечисленного ниже обычно использует методы интеллектуального анализа данных?
Правильный ответ: Все вышеперечисленное
Что из нижеперечисленного обозначает копирование одних и тех же данных?
Правильный ответ: Репликация
Что из нижеперечисленного поддерживает все Hive DDL, для которых не требуется выполнение MapReduce?
Правильный ответ: HCatalog CLI
Что из нижеперечисленного поможет удовлетворить изменяющиеся требования к анализу отчетов конечного пользователя
Правильный ответ: Предоставление конечным пользователям возможность создавать свои собственные отчеты
Что из нижеперечисленного является демоном Hadoop’a?
Правильный ответ: Все вышеперечисленные
Что из нижеперечисленного является отношением?
Правильный ответ: связь между сущностями
Что из нижеперечисленного является проблемой с ресурсами данных?
Правильный ответ: Всё вышеперечисленное
Что из перечисленного не входит в главные преимущества NoSQL для организаций?
Правильный ответ: Поддержка согласованности данных.
Что из перечисленного не обеспечивает работу с NoSQL?
Правильный ответ: PostgreSQL.
Что из перечисленного не связано с интеллектуальным анализом данных?
Правильный ответ: Преобразование данных
Предыдущая страница
Что из перечисленного не является базой данных NoSQL?
Правильный ответ: SQL Server.
Что из перечисленного не является командой Hive DDL
Правильный ответ: Ничего из этого
Что из перечисленного не является компонентом хранилища данных?