Какие преимущества даёт обучение в Яндекс Практикуме?

Name: Инженер данных
Brand: Яндекс Практикум
SKU: data-engineer
Availability: InStock

100 000+ выпускников 💻 Много проектов 🖤 Поддержка экспертов

Курс «Инженер данных» - онлайн-обучение профессии Data Engineer

Освоите проектирование пайплайнов
Узнаете, как создавать витрины и хранилища
Научитесь обрабатывать данные разными инструментами
Погрузитесь в рабочую среду инженера данных
Сделаете и добавите в портфолио 8 проектов
Получите сертификат о переподготовке

Кому подойдёт курс

Специалистам по Data Science и аналитикам

Освоите новые инструменты, чтобы эффективнее справляться с задачами. Научитесь строить хранилища и витрины данных, проектировать пайплайны, готовить данные к машинному обучению.

Начинающим инженерам данных

Систематизируете знания и отработаете их на практике. Решите проекты, которые войдут в портфолио, выделят вас на фоне других кандидатов и помогут расти в карьере.

Практикующим разработчикам

Получите навыки и знания инженера данных, чтобы использовать их на текущей должности или сменить работу. Освоите архитектуры данных, ETL-процессы, Airflow, PySpark и другие инструменты.

Вам понадобятся знания SQL и Python, чтобы пройти курс

Если у вас их пока нет, присмотритесь к курсу «Инженер данных» с нуля

Освоите всю необходимую базу для уверенного старта в профессии — даже если у вас нет технического образования и опыта в IT

Посмотреть курс

Что нужно знать по SQL:

Базовый синтаксис: операторы SELECT, GROUP BY, WHERE, HAVING и JOIN
Вложенные запросы и их комбинирование
Оконные функции
Ускорение запросов с помощью индексов по вторичному ключу

Что нужно знать по Python:

Базовый синтаксис: переменные, циклы, функции, условия
Структуры данных: список, словарь, кортеж, работа с индексами
Базовые операции с Pandas: открыть csv‑файл, посчитать простую агрегацию по столбцу
Основы объектно ориентированного программирования

Освоите актуальные инструменты и сможете сменить профессию или вырасти на текущей должности

Metabase

Airflow

PostgreSQL

MongoDB

Docker

Redis

Yandex.Cloud

Kafka

Hadoop

Apache Spark

Spark Streaming

NoSQL

И расширите зарплатные возможности

Источник: Хабр Карьера

95 000–175 000 ₽

Junior

175 000–290 000 ₽

Middle

290 000+ ₽

Senior

3 темы・1 проект・~4 часа

Бесплатно

Как стать инженером данных

1 модуль — бесплатно, чтобы вы попробовали курс и решили, подходит ли он вам

SQL
PostgreSQL
Metabase

Входное тестирование

Ответите на несколько вопросов и поймёте, достаточно ли у вас знаний и навыков, чтобы комфортно проходить курс

Окружение инженера данных

Узнаете, чем занимается инженер данных и как именно он работает с данными, а ещё выясните, чем отличаются инженеры данных от других специалистов

Инфраструктура инженерии данных

Разберётесь в инструментах и технология, которыми пользуются инженеры данных на разных этапах работы

Примерите роль начинающего инженера данных, который только вышел на работу в IT‑компанию: получите требования от лида и построите по ним витрину данных

5 тем・1 проект・2 недели

Как построить аналитическое хранилище данных

Python
PostgreSQL
DBeaver
DWH
SCD

PostgreSQL и DBeaver

Виды данных по степени строгости организации, различия и назначение баз данных SQL и NoSQL, характеристики PostgreSQL, интерфейс и возможности DBeaver

Нормальные формы

Понятие нормализации, нормальные формы

Знакомство с DWH

Минусы нормализации, хранилище данных, OLTP и OLAP, денормализованные модели

Погружение в DWH

Сбор требований, подходы Инмона и Кимбалла, современные модели DWH, выбор подхода для DWH, создание процессов миграции данных

SCD и его типы

Понятие и типы

Построите витрину с инкрементальной загрузкой для аналитики аудитории интернет‑магазина

2 темы・1 проект・3 недели

Работа с данными в хранилище

PostgreSQL
VIEW
Витрина данных

Витрина данных и VIEW

Понятие витрины данных, транзакции, инкрементальная загрузка данных, понятие VIEW, визуализация данных

Оптимизация запросов

План запроса, как исследовать запрос, типы индексов и способы их создания

Приведёте в порядок модель данных и осуществите миграцию в текущем хранилище

4 темы・1 проект・3 недели

ETL: автоматизация подготовки данных

Python
PostgreSQL
Airflow

Анализ вводных по задаче

ETL-процесс и его пайплайн, требования к ETL-процессу, источники данных, разложение данных по слоям, подключение к API и базам данных, схемы источника, перенос данных в хранилище, автоматизация

Проектирование ETL-процесса

Виды загрузок, слои хранения, как разложить данные по готовым слоям, порядок загрузки объектов, проектирование системы восстановления

Ликбез по Airflow

Понятие, для каких задач используется Airflow, основные концепции, архитектура, первый взгляд на UI, структура кода DAG, статусная модель задач, механики шаблонов, особенности работы со временем, продвинутые механики и альтернативы Airflow для ETL-процессов

Реализация ETL в Airflow

Планирование процесса, как сделать запрос на генерацию файла через API, подключение к хранилищу и получение файла, переведение файла в табличный вид, SCD, добавление технических полей, обновление слоя витрин, постановка процесса на регламент

Построите пайплайн автоматизированного получения, обработки и загрузки данных от источников до витрины

2 темы・1 неделя

Проверка качества данных

Требования к качеству данных

Технические и бизнес-качества, как собрать требования к данным, система контроля качества

Проектирование и разработка проверки

Выбор места проверки в пайплайне, разработка проверок, результаты и отслеживание проверок, runbook процесса

Научитесь оценивать качество данных

4 темы・1 проект・2 недели

DWH для нескольких источников

NoSQL
MongoDB
PostgreSQL

Сбор требований и исследование источников

Сбор требований для DWH, модель данных в PostgreSQL, MongoDB как NoSQL-СУБД, подключение к MongoDB, данные в MongoDB, как связаны данные в источниках

Проектирование DWH

Проектирование хранилища по слоям, выбор модели данных, проектирование слоёв CDM и STG, хранение исторических данных, проектирование слоя DDS, проектирование ETL между слоями

Реализация DWH

Транзакции и их свойства, изоляция транзакций, паттерн Transactional Outbox, сбор данных из PostgreSQL и MongoDB, перенос данных из STG в DDS, заполнение витрины в слое CDM

Тестирование, интеграция и документация

Тестирование DWH, интеграция с BI‑решением, как писать документацию к DWH

Спроектируете и реализуете DWH для стартапа

2 темы・1 проект・2 недели

Аналитические базы данных

S3
Vertica
Airflow
PostgreSQL

Аналитические СУБД и Vertica

Знакомство с аналитическими СУБД и Vertica, типы данных в Vertica (строковые и числовые, временные и специальные), запись данных в Vertica, проекции, параметры сегментации и сортировки, удаление и обновление данных в Vertica, партиционирование таблиц, операции с партициями

Разработка аналитической базы данных

Исходные данные, staging-слой, проверка качества данных, выбор модели для аналитического хранилища, разработка аналитического хранилища

Построите DWH для высоконагруженной системы данных с использованием Vertica

3 темы・1 проект・4 недели

Организация Data Lake

HDFS
Hadoop
MapReduce
Apache Spark

Проектирование Data Lake

Знакомство с Data Lake, сбор требований, знакомство с Hadoop, архитектура HDFS, репликация данных и блоки в HDFS, управление HDFS из консоли, проектирование хранения данных в HDFS

Знакомство со Spark

Парадигма MapReduce, знакомство со Spark, вычисления в Spark, знакомство с YARN, подключение к Spark

PySpark для инженера данных

Знакомство с PySpark, структуры данных в Spark, создание DataFrame и базовые операции: преобразования и действия, JOIN и UNION, кеширование и контрольные точки; встроенные стандартные функции, оконные функции в PySpark, как собрать, запустить и автоматизировать джобу

Построите Data Lake и автоматизируете загрузку и обработку данных в нём

2 темы・1 проект・3 недели

Потоковая обработка данных

Kafka
Spark Streaming

Потоковая обработка с Kafka и Spark Streaming

Что такое потоковая обработка, брокеры сообщений, Kafka, работа с Kafka через kcat, знакомство со Spark Structured Streaming — базовые операции, как создать Spark Streaming Application

Настройка потока данных

Сбор требований к стримингу, проектирование стриминговой системы, изучение данных в Kafka, преобразование потоковых данных, дедупликация, подключение к PostgreSQL и изучение данных, проектирование выходного сообщения, отправка сообщения в Kafka

Разработаете систему для обработки данных в режиме реального времени

5 тем・1 проект・3 недели

Облачные технологии

Redis
NoSQL
Kubectl
Kubernetes
PostgreSQL
Yandex Cloud

Облачные технологии Yandex Cloud

Что такое облачные технологии, подключение к Yandex Cloud, внутри Yandex Cloud, сбор требований к DWH

Подготовка и изучение источников

Redis — key-value хранилище, как его поднять в Yandex Cloud, изучение данных в Redis, как поднять Kafka в Yandex Cloud, изучение данных в Kafka

Создание окружения сервисов

Микросервисная архитектура, контейнеризация в Docker, создание образов контейнеров, репозиторий для образов, знакомство с Kubernetes, возможности утилиты kubectl, подготовка манифестов, пакетный менеджер Helm, разбор шаблона сервиса

Написание первого сервиса

Как поднять PostgreSQL в Yandex Cloud, структура баз данных, подготовка контейнера, планирование и написание логики первого сервиса

Знакомство с DataLens

Подключение источников данных, создание диаграмм, создание дашборда

Разработаете инфраструктуру для хранения и обработки данных в облаке

Самостоятельно・2 недели

Итоговый проект или пет-проект

В конце курса у вас будет выбор: выполнить ещё один учебный проект или реализовать пет-проект. В первом случае нужно выбрать бизнес-задачу и разработать архитектуру данных с использованием всех изученных инструментов. Во втором случае вы сможете воплотить в жизнь и защитить личный проект. Идея для пет-проекта может быть любой, главное — чтобы она была связана с инженерией данных и при её реализации использовались все изученные инструменты. Что бы вы ни выбрали, вас поддержат наставники и ревьюеры, а получившийся кейс украсит ваше портфолио.

Как вы будете учиться

Где угодно, с комфортным графиком

Читать теорию и выполнять задания можно из любой точки мира. Обучение будет разбито на спринты по несколько недель, а график составлен так, чтобы учёбу было удобно совмещать с другими делами.

На примерах из жизни и с постоянной практикой

С первого дня вы учитесь на практике. Мы даём знания небольшими частями, которые нужно сразу применить, написав собственный код. Решать задания вы будете с помощью реальных инструментов: оркестраторов, контейнеров и BI-систем.

С учебными проектами

Вас ждёт 8 проектов — это типичные для инженера данных задачи из разных сфер бизнеса. Сможете добавить их в портфолио, набраться опыта и увереннее искать работу после курса или применять новые знания на текущем месте.

Практикум AI помогает учиться

Когда в теории что-то непонятно, нейросеть объяснит это другими словами. А в конце каждого урока подготовит краткий пересказ о самом главном.

2 формата обучения на выбор

С дедлайнами. Модули открываются по расписанию — их важно проходить за определённое время. Проекты тоже нужно сдавать точно в срок.
В своём темпе. Темы и задания открываются по мере прохождения. Можно завершить курс быстрее или продлить обучение на 2 месяца.

Подробнее об обучении в своём темпе

В качестве выпускной работы сможете выполнить пет‑проект — то есть сами выберете тему и пути решения

Такой проект может заметно усилить ваше портфолио

Он должен быть основан на открытых источниках, а тема — связана с инженерией данных
Будете использовать технологии, которые освоили на курсе, чтобы продемонстрировать свои знания
Представите результаты перед командой курса и другими студентами — расскажете о задумке и ценности своей работы

Начать учиться бесплатно

Этот курс может оплатить
ваш работодатель

Полностью или разделив оплату с вами,
например 50/50 или 75/25

Расскажем всё про курс
Сообщим стоимость
Ответим на ваши вопросы
Подготовим договор и счёт

Оставьте заявку, получите скидку 20% и набор подарков

Свяжемся с вами, ответим на вопросы и пришлём промокод

Курс составили специалисты с внушительным опытом, а в учёбе вас поддержит заботливая команда

Наставники учат находить ответы

Все наставники — опытные инженеры данных, которые проводят вебинары и учат применять навыки на практике

Начать учиться бесплатно

Что ещё важно

Перенесём дедлайн или предложим перейти в следующий поток

Дедлайн сдачи проекта можно сдвинуть на неделю. Если нужно больше времени, куратор поможет перевестись в более поздний поток. Так вы сможете пройти темы и закончить проект в комфортном темпе.

Вернём деньги за остаток курса, если передумаете

Нужно будет оплатить только время с начала вашего первого потока. Подробнее об условиях — в 7 пункте оферты.

Почитать оферту

Выдадим сертификат о переподготовке

Отправим его на вашу электронную почту.

Обучение будет проходить на русском языке

Теория, практика и воркшопы, а ещё чаты с куратором, наставником и другими студентами.

Что говорят выпускники

У курса много плюсов:

— Классный коллектив наставников и ревьюверов.

— Хорошо подобранный материал: всё на своем месте, темы нужные.

— Быстро отвечают на вопросы и решают проблемы.

— Много дополнительных воркшопов.

Самое ценное — это код-ревью на проекте. Ребята молодцы, всё пишут по делу.

Из минусов — у нас, как у первой когорты, были проблемы с инфраструктурой. Но это было частично прогнозировано. Я сильного дискомфорта из-за этого не испытал.

Ещё момент, что трудно выдержать такой темп. Если бы не свободное время на моей работе, то было бы практически нереально пройти курс. Поэтому нужно понимать, что обучение заберёт много времени, и отдавать себе отчёт: благодаря этому Практикум держит марку как компания, которая не выпускает абы кого.

Однозначно могу рекомендовать курс друзьям. Я очень доволен. Благодаря вектору обучения, я сделал свой pet-проект и нашёл новую работу, так что своё дело обучение сделало. Оно не дало мне глубокое знание во всех областях, но дало понимание, базу. Это правильно.

Искать курс по DE я начала уже после того, как устроилась на работу в качестве DE и поняла, что мне предстоит работать с определённым набором инструментов, с которым раньше я не работала. Практикум я выбрала, потому что других курсов с охватом такого большого набора релевантных тем мне как-то больше и не попалось. Репутация Яндекса тоже подействовала, и я записалась. И попала, как оказалось, в самую первую когорту студентов по курсу DE. То, что это была первая когорта, было заметно, так как не везде всё работало гладко, и иногда я даже злилась.

Тем не менее, я очень рада, что прошла этот курс. Так как я получила знания, которые искала, и, что самое главное, непосредственный опыт работы с нужными мне инструментами на достаточно реалистичных учебных проектах. А те технические накладки, с которыми мы сталкивались, в определённом смысле даже способствовали более глубокому погружению в тему. Для начинающих DE курс очень хороший, рекомендую!

Обучение требует действительно много времени и усилий, но результат многократно окупит все усилия. Однозначно рекомендую.

На курсы я пришёл, будучи студентом бакалавриата и обладая только опытом программирования на Python (оглядываясь назад, понимаю: уровень был ниже среднего) и написания скриптов на SQL (уровень аналогичен). Обучение было хоть и тяжёлым и занимающим много времени, но невероятно интересным. Каждый спринт был насыщен информацией и грамотно составлен: новые технологии сначала объясняются с теоретической стороны, и только потом начинается практика, от простых заданий к сложным.

Сама платформа достаточно удобная. По любым вопросам, организационным или по обучению, можно связаться с куратором или наставником, которые окажут поддержку и в короткие сроки помогут решить проблемы. Тем не менее, учиться придётся самостоятельно. Гораздо полезнее стараться во всех вопросах, пусть на первый взгляд они и кажутся неразрешимыми, попытаться разобраться самому, в процессе укрепляя понимание той или иной технологии. Кстати о них, обучают здесь только современным вещам, легаси не завезли:) Из этого вытекает ещё один плюс: ко многим технологиям нет документации на русском, поэтому нужно быть морально готовым читать техническую документацию на английском, и читать много. Это крайне полезный навык, и я искренне советую не пропускать такие моменты.

Резюмируя, я остался крайне доволен, и хотя иногда хотелось всё бросить, я рад, что дошёл до конца и не жалею о потраченном времени:)

Это было увлекательное и сложное приключение!

Удалось:

— Структурировать знания о классическом построении хранилищ данных.

— Получить знания о продвинутых методологиях: якорная модель и Data Vault.

— Много практиковаться в SQL, Python, Docker.

— Узнать и применить на практике новые инструменты: Airflow, Kafka, Spark (Spark Streaming).

— Получить опыт решения задачи в сжатые сроки, когда ты вынужден выбирать компромисс из решений. Хакатон — это было круто🔥

— Ну и, конечно, потраблшутить🤯 и разбираться с непонятными формулировками, некачественными данными и работающей со сбоями инфраструктурой. Всё как в реальной жизни, и даже чуточку больше.

Курс заколил нервную систему и повысил практические навыки как в использовании новых инструментов, так и в прокачивании Python💪

Отвечаем на вопросы

Подойдёт ли мне эта профессия?

Для тех, кто ещё нетвёрдо уверен в своём намерении, мы спроектировали бесплатную часть, которая поможет получить ответ на этот вопрос. Если вы убедитесь, что инженерия данных не для вас, это тоже положительный результат.
Подробнее о профессии инженера данных вы можете узнать из нашей статьи.

Можно ли обучиться профессии за 6,5 месяцев?

Думаем, что да. Для этого уделяйте занятиям в среднем от 12 часов в неделю: читайте теорию в тренажёре, выполняйте задания, разрабатывайте проекты и общайтесь с наставником.

Каким требованиям нужно соответствовать?

Чтобы проходить курс, вам понадобятся базовые знания по SQL и Python.

Что нужно знать по SQL:
• Базовый синтаксис: операторы SELECT, GROUP BY, WHERE, HAVING и JOIN
• Вложенные запросы и их комбинирование
• Оконные функции
• Ускорение запросов с помощью индексов по вторичному ключу

Что нужно знать по Python:
• Базовый синтаксис: переменные, циклы, функции, условия
• Структуры данных: список, словарь, кортеж, работа с индексами
• Базовые операции с Pandas: открыть csv-файл, посчитать простую агрегацию по столбцу
• Основы объектно ориентированного программирования

Кто будет меня учить?

Программа составлена опытными преподавателями, методологами и действующими специалистами не только Яндекса, но и других лидеров технологической и образовательной индустрии.

Как и когда я буду учиться?

Обучение состоит из 3 больших частей: теории с закреплением в тренажёре, домашних заданий с самостоятельными проектами и вебинаров с наставниками и экспертами из индустрии.

Теория в тренажёре и домашние задания не привязаны к расписанию — можно учиться когда угодно. Главное — уложиться в дедлайн, обычно это спринт из 2 недель. Вебинары проходят в определённое время, о котором вам заранее скажет куратор.

Что делать, если я не справлюсь с нагрузкой?

В программе предусмотрены каникулы, во время которых можно отдохнуть или повторить сложные темы.

Если случилось непредвиденное или понадобилось больше времени на закрепление материала, напишите своему куратору. Он поможет перенести дедлайн сдачи проекта или перевестись в более поздний поток. На общую стоимость курса это не повлияет.

Если не понравится, я могу вернуть деньги?

Конечно. Если поток ещё не стартовал, вернём всю сумму. Если учёба уже началась, придётся оплатить прошедшие дни со старта вашего первого потока — но мы вернём деньги за остаток курса. Более подробно рассказываем об этом в 7 пункте оферты.

Получу ли я какой-то документ после курса?

Да, для этого нужно закончить курс и успешно выполнить итоговый проект. Тогда выдадим вам сертификат о переподготовке в электронном виде.

А если не получится, по запросу выдадим электронную справку об обучении — с перечнем модулей, которые вы освоили.

Вы поможете сменить или найти работу?

На этом курсе не предусмотрена помощь с трудоустройством, поскольку он для действующих специалистов, у которых уже есть навыки поиска работы.

Но если у вас появится вопрос о карьерном развитии, обратитесь в нашу службу поддержки — постараемся ответить.

Как можно оплатить?

Банковской картой: внести всю сумму сразу или платить ежемесячно.

Ежемесячные платежи работают так: вы вносите первую оплату, и в этот момент привязывается карта. С этой карты автоматически будут списываться следующие платежи каждые 30 календарных дней. Например, оплатили 25 марта — следующий платёж пройдёт 24 апреля. Обучение будет стоить меньше, если оплатить весь курс сразу.

Через компанию: юридические лица также могут оплатить обучение в Практикуме. Чтобы заказать счёт для оплаты, оставьте заявку на странице для корпоративных клиентов.

На каком языке проходит обучение?

Всё будет на русском: теория, практические задания и вебинары, а ещё чаты с куратором, наставником и другими студентами.

Давайте поможем

Напишите, как вас зовут и по какому номеру можно связываться, — в течение 30 минут позвоним и расскажем всё про курсы

Соглашаюсь на обработку персональных данных

Курс «Инженер данных»

И расширите зарплатные возможности

Оставьте заявку, получите скидку 20% и набор подарков

О нас

Партнёрам

Давайте поможем