Чему вы научитесь?
За 10 месяцев вы освоите комплекс фундаментальных знаний, практических навыков и инструментов для работы junior дата-инженером
Python: основы языка
изучите основы языка Python с нуля, научитесь создавать переменные и освоите контейнерные типы данных, научитесь работать с циклами и условиями, научитесь работать с файлами и выполнять многие другие действия, создавать классы и объекты и овладеете объектно-ориентированным программированием
SQL для прикладных задач
изучите язык запросов SQL, операторы SELECT, INSERT, UPDATE, DELETE, функции базы данных, хранимые процедуры, работа с несколькими таблицами, соединения JOIN и транзакции, автоматизируете процессы сбора, очистки и анализа реальных данных (ETL), научитесь работать с хранилищами данных (DWH)
Инструменты работы с большими данными
Линукс/Гит (Linux / Git) для начинающих
Научитесь пользоваться распределенной файловой системой, запускать задачи на Hadoop кластере, писать задачи для запуска на Hadoop кластере с помощью нативного Java-интерфейса, работать с большими объемами данных и располагать кругозором в выборе архитектурного решения поставленной задачи, писать задачи для запуска на Hadoop кластере с помощью любого другого языка программирования (с помощью инструментария Hadoop streaming)
Вы научитесь работать в среде Linux, включая выполнение основных команд и использование Linux при работе в Windows, подключаться к удалённым серверам и обмениваться данными, выполнять удалённую отладку программ, а также работать с системой контроля версий Git: настраивать окружение, создавать репозитории, управлять файлами и ветками.
Все курсы содержат множество практических занятий и заданий, которые помогут вам получить практический опыт и навыки.