Data Warehouse Analyst - безплатен курс от Otus, обучение 5 месеца, дата 30 ноември 2023 г.
разни / / December 04, 2023
Аналитичните приложения днес са изградени в пресечната точка на инженерните практики (софтуер/инженерство на данни), разбиране на спецификата на продуктите и бизнеса (Data/Business Analysis), бързо и качествено предоставяне на услуги (DevOps).
Курсът има за цел да научи студентите как да сглобяват цялостни аналитични решения от край до край, като използват най-подходящите и търсени инструменти.
Материалът ще бъде изучаван както в дълбочина (например принципите на функциониране на аналитичните СУБД), така и в широчина (сравнение на инструменти, анализ на силните и слабите страни на решенията).
Какви нови неща мога да науча?
За ролите Data Scientist, Data Analyst, Product Analyst:
– Принципи на работа на аналитични СУБД и изграждане на ELT-тръбопроводи
– Използване на най-добрите практики за моделиране на хранилища и магазини за данни
– Прилагане на правилните архитектурни модели при изграждане на решения
За ролите Data Engineer, Backend Developer, DBA, System Administrator:
– Практики за изграждане на аналитични решения от край до край
– Приложни умения по визуализация, dashboarding, BI
– Съсредоточете се върху създаването на бизнес стойност
Курсът ще обхваща:
– Умения за изграждане на ELT-тръбопроводи: Airflow, Nifi, Stitch
– Принципи на работа на аналитичните СУБД: Redshift, Greenplum, Clickhouse
– Най-добри практики за моделиране на данни: dbt, Data Vault
– Визуализация и BI: Metabase, Superset, DataLens
– Разширен анализ: KPI, фунии, маркетингово приписване, кохорта, RFM
– DevOps практики: непрекъсната интеграция, Github действия
6
курсовеИнженер по данни в Wildberries, DE Младши лектор на курса. Повече от 7 години в ИТ
Завършил Воронежския държавен университет с отличие. В момента студент в магистърската програма на HSE "Системно и софтуерно инженерство". Професионален опит - 2 години работа като Data Analyst и Data Engineer. Сега работи с 5 популярни бази данни, развива се в Python и бързо развива уменията си. Готов съм да споделя опита си.
1
добреПовече от 6 години опит в разработването на хранилища за данни, ELT тръбопроводи, анализ на данни и визуализация. Опит в областта на държавната сигурност, създаване и внедряване на KHD LLC "Група от компании "СБСВ-Ключавто", в момента...
Повече от 6 години опит в разработването на хранилища за данни, ELT тръбопроводи, анализ на данни и визуализация. Опит в областта на държавната сигурност, създаване и внедряване на QCD LLC "Група от компании "СБСВ-Ключавто", в момента разработва QCD за групата компании Delo съм уверен, че данните са вторият петрол, вид собственост, която трябва да можете да управлявате и отървавам се от. Наличието на организирани данни, тяхното правилно съхранение, използване, продажба, анонимизиране показват високо ниво на дигитална зрялост. Учител
3
курсАлександра работи в сферата на анализите и BI от 2019 г. По това време тя получава бакалавърска степен по софтуерно инженерство от Държавния университет по авиационна администрация в Санкт Петербург, а след това и магистърска степен. Първи стъпки в...
Александра работи в сферата на анализите и BI от 2019 г. По това време тя получава бакалавърска степен по софтуерно инженерство от Държавния университет по авиационна администрация в Санкт Петербург, а след това и магистърска степен. Първите стъпки в кариерата си прави в американската компания Intermedia Cloud Communications като младши анализатор на данни, а до 2021 г. успява да оглави екипа за анализи. Цялата тази година беше посветена на нов междуекипен проект за международно финансово управление на стека на Microsoft (MS SQL Сървър, SSRS, SSIS, Power BI).От март 2022 г. работи в групата компании Tinkoff Bank като складов анализатор данни. Осигурява подкрепа на висшето ръководство на финансовия отдел при изграждането на прототипи на ETL процеси с помощта на Greenplum, ad-hoc анализи в Python, отчети и визуализация в Tableau. През 2020 г. получава допълнително образование в направление Мениджър управление на проекти в ИТ. Той е твърд привърженик на гъвкавите методологии за развитие. Вярва, че най-печелившите инвестиции са инвестициите в собственото развитие. Стек: SQL, SAS DIS, SSIS, Tableau, Power BI, Python
ELT: Структура и видове източници на данни
-Тема 1. Източници на данни: класификация и характеристики
-Тема 2. Инструменти за изтегляне на данни – 1
-Тема 3. Инструменти за изтегляне на данни – 2
Основи на DWH
-Тема 4. Аналитични машини (СУБД) за работа с данни
-Тема 5. Принципи на изграждане на СВТ
-Тема 6.DZ анализ – Качване на данни от уеб брояч
-Тема 7. Въведение в инструмента за изграждане на данни
-Тема 8.DBT: Аналитично инженерство
DWH Междинен
-Тема 9. Оркестрация на сценарии и задачи – 1
-Тема 10. Оркестрация на сценарии и задачи – 2
-Тема 11.DZ анализ – Конфигуриране и стартиране на dbt проекта
-Тема 12. Качество на данните
-Тема 13. Проблеми с оптимизирането на производителността
-Тема 14. Хранилище за данни – 1
-Тема 15. Хранилище за данни – 2
-Тема 16.DZ анализ – Подготовка и настройка на DAG график за изтегляне на данни от източници
Бизнес разузнаване
-Тема 17.BI: Обзор
-Тема 18.BI: Разгръщане
-Тема 19.BI: Моделиране и доставка
-Тема 20.DZ анализ – Организация на подробен DWH слой с помощта на методологията Data Vault
-Тема 21. Аналитика: Основни аналитични витрини
-Тема 22.BI: Задълбочени въпроси
-Тема 23. DZ Razor – Конфигуриране и внедряване на BI решение
-Тема 24. Анализи: Витрини за разширен анализ
DWH Разширени теми
-Тема 25.DWH: Теми за напреднали
-Тема 26.DBT: Разширяване с модули
-Тема 27.DWH: Мониторинг + Управление на натоварването
-Тема 28.DZ анализ – Визуализация и табло за аналитични витрини
-Тема 29.DWH: Външни + Полуструктурирани данни
-Тема 30.DWH: Обратно-ETL
-Тема 31.DWH: Възможности за машинно обучение
Обобщение
-Тема 32. Анализ на казус: решение от край до край
-Тема 33.DZ анализ – Advanced DWH: Конфигуриране на CI, dbt модули, външни таблици
-Тема 34. По-нататъшно развитие на уменията
Работа по проект
-Тема 35. Избор на тема и организация на работата по проекта
-Тема 36. Защита на проектантска работа