Действует акция «Скидки до -75%»

Новые раздачи

04-Июл	Анастасия Дубинская, Ревитоника — Лифтинг лица. Продвинутый курс (2025)
04-Июл	Григорий Басов, Юлия Ветушко, Ревитоника — Сам себе остеопат (2025)
04-Июл	Алина Макарова, Cake School — Азиатская коллекция начинок моти (2025)
04-Июл	Алексей Капранов — Психодайвинг 20. Самоедство и самоанализ (Лекция)
04-Июл	Ирина Шиманская — Победите анемию с помощью питания, специй, трав и ЗОЖ. Тариф Общий (2025)
04-Июл	Марина Сорокина, angry_pelmenator — Школа машинного вязания «Начало» (2025)
04-Июл	Ирина Тимошенко — Личное счастье. Перспективы в карте (2023)
04-Июл	Лариса Зубенкова, Stepik — Сводные таблицы и Дашборды в Excel (2025)
04-Июл	Альбина Скрипка — Создай свою марку белья и заработай! (2021)
04-Июл	Андрей Космач — Кремлёвский мистериум и классические культы подлунного мира (2025)

Стройкова - Pазработчик bigdata. Модуль 4 (2018) бесплатно

Главная » Программирование и администрирование » Стройкова - Pазработчик bigdata. Модуль 4 (2018)

Автор

Сообщение

Prescious ^®

Pазработчик bigdata. Модуль 4
Ксения Стройкова

Четвертый модуль:

Большую часть времени любого разработчика процессов анализа данных занимает разработка самого процесса по преобразованию данных на разных этапах. Предполагаются этапы сбора, очистки, агрегации данных, построения модели и предсказания характеристик.
В четвертом модуле рассматриваются возможности построения надежных процессов преобразования данных.В более крупных компаниях данные превышают возможности одной типичной разработческой машины. Появляется потребность работы с алгоритмами, обрабатывающими данные в потоке, а также с кластером.
В четвертом модуле разбираются процессы преобразования данных, слои данных, потоки данных и различные способы хранения и преобразования таких данных на кластере. Разберем возможности построения моделей на кластере. К концу модуля слушатели смогут уверенно использовать стек технологий Hadoop: писать задачи на MapReduce с использованием Java или Hadoop Streaming, использовать Hive и Spark для быстрого преобразования данных, расчета статистик, построения моделей на кластере.
Занятие 25: Процесс CRISP-DM. Выбор хранилища, запросы к базе (Реляционная, нереляционная). Большие данные и параллельные вычисления.
Кластер, hdfs, запросы к hdfs. Map Reduce, Java, Python, Необходимость в кластерных вычислениях. Парадигма MapReduce. Инструменты работы с большими данными. Hadoop, Spark, обзор других компонентов экосистемы. Развертывание кластера Hadoop локально для выполнения учебных примеров. Выполнение учебных примеров на кластере.
ДЗ
Настройка окружения для локальной работы с кластером. Выполнение на локальном кластере набора учебных задач.
Занятие 26: Vowpal Wabbit для обучения линейных моделей на одной машине
Занятие 27: MapReduce на Java, Hadoop Streaming - MapReduce на Python, bash
ДЗ
Реализация алгоритма с использованием MapReduce.
Занятие 28: Пайплайны. Способы выстроить поток задач, обеспечить выполнение. Отказоустойчивость, мониторинг.
Занятие 29: Слои данных для оптимизации процессов использования данных. Hive.
ДЗ
Реализация алгоритма с использованием Hive.
Занятие 30: Организация хранения данных для решения задач машинного обучения
Занятие 31: Spark
Spark как инструмент быстрого доступа к данным. Spark как инструмент для машинного обучения.
ДЗ
Реализация алгоритма с использованием Spark.
Занятие 32: Обзор решений для аналитики больших данных
Vertica, Clickhouse. Основные преимущества и недостатки, для хранения и обработки данных.
Агрегация, управление, эксперименты, анализ, визуализация и BI

Продажник:
Pазработчик bigdata. Модуль 4
↓ Скачать: ↓

Слив складчины:

Чтобы скачать файл "Стройкова - Pазработчик bigdata. Модуль 4 (2018)"

Вам нужно Авторизоваться на сайте под своим логином. Если у Вы ещё не зарегистрированы, тогда Вам нужно пройти Регистрацию

Главная » Программирование и администрирование » Стройкова - Pазработчик bigdata. Модуль 4 (2018)

Скачать Стройкова - Pазработчик bigdata. Модуль 4 (2018) слив курса.

Текущее время: Сегодня 21:48

Часовой пояс: GMT + 4

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы

Связь с администрацией | Для правообладателей

⇧

⇩

Новые раздачи

Стройкова - Pазработчик bigdata. Модуль 4 (2018) бесплатно

Четвертый модуль&#58;

Чтобы скачать файл "Стройкова - Pазработчик bigdata. Модуль 4 (2018)"

Скачать Стройкова - Pазработчик bigdata. Модуль 4 (2018) слив курса.

Четвертый модуль: