Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лаб 4 БСТ1904 Пантелеева

.docx
Скачиваний:
69
Добавлен:
04.03.2022
Размер:
824.71 Кб
Скачать

Министерство цифрового развития, связи и массовых коммуникаций Российской Федерации

Ордена Трудового Красного Знамени

Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования

Московский технический университет связи и информатики

Дисциплина «Большие данные»

Лабораторная работа №4

Выполнила:

Студентка группы БСТ1904

Пантелеева К.А.

Проверила:

Пугачева М.А.

Москва, 2021

Цель.

Ознакомится с процессами Hive и HBase.

Задание.

HIVE

  1. Скачать любой датасет из списка ниже.

  2. Загрузить этот датасет в HDFS в свою домашнюю папку.

  1. Создать собственную базу данных в HIVE. (create database).

  1. Создать таблицы внутри базы данных с использованием одного файла из загруженного датасета (предварительно создать таблицу с форматами аналогичными вашим данным в выбраной таблице, см.приложение).

  1. Сделать любой простой отчет по загруженным данным используя груповые и агрегатные функции.

HBASE.

  1. Создать таблицу

  1. Посмотреть информацию о ней (list/describe оба варианта)

  1. Положить в нее данные (3-5 строк)

  1. Просканировать

  1. Получить конкретную строку

  1. Заблокировать/разблокировать таблицу

  1. Удалить таблицу