Специализация "Анализатор на данни" - курс 2900 rub. от Stepik, обучение 36 урока, Дата: 29 октомври 2023 г.
разни / / December 05, 2023
Data alyst, product analyst, customer base analyst, CRM analyst, data scientist – всички тези професии са свързани с анализ на данни.
🎯 ТОП изисквания за тези професии:
- Познания по SQL и опит в работата с бази данни;
- Познаване на основния синтаксис на Python и познаване на библиотеката Pandas;
- Познаване на статистиката и способност за прилагането й при анализ на данни;
- Аналитично мислене.
Това не е пълен списък. Например уеб анализаторите трябва да познават Google Analytics и Yandex. Метрики, а за специалистите по данни - машинно обучение. Но аз дадох основните изисквания, които се срещат в 70-80% от свободните позиции.
Специализацията Data Analyst в момента се състои от два курса:
1️⃣ SQL за всеки
По време на курса ще овладеете SQL до нивото на писане на сложни SQL заявки и ще практикувате да използвате данни от търговска компания в една от най-популярните системи за управление на бази данни.
Курсът е предназначен за начинаещи, които искат да овладеят SQL, както и за тези, които владеят SQL на основно ниво, но искат да попълнят пропуските и да затвърдят знанията си на практика.
2️⃣ Python: Анализ на данни с Pandas
Курсът е посветен на практическа работа с Pandas. Ще получите необходимата теория и ще я затвърдите с голям брой практически задачи.
Курсът е подходящ за тези, които вече са запознати с основния синтаксис на Python:
- Познава основни типове данни (включително списъци и речници) и операции с тях;
- Има разбиране какво е функция и метод.
Курсът може да бъде взет дори от начинаещи, които могат самостоятелно да разберат как да инсталират Python и библиотеката Pandas. Но ако тепърва започвате с Python, ще трябва да наваксате някои основни неща сами, докато курсът напредва. Между другото, можете да получите основни познания за синтаксиса на Python в този курс. Тогава изучаването на панди ще бъде много по-лесно.
Концепцията на курсовете се основава на три принципа:
Простота
Представянето на материала е достъпно и последователно - това ще ви позволи да формирате необходимата база от знания стъпка по стъпка.
Практикувайте
Много внимание се обръща на практиката - така че не само да решавате проблемите на курса, но и да можете да прилагате знанията в бъдеще, върху реални проекти.
поддържа
Чувствайте се свободни да задавате въпроси в коментарите, за мен е важно целият материал да бъде научен. Отговарям на коментари в рамките на един ден.
Редът, в който се провеждат курсовете, не е важен.
1. SQL за всеки
Операции на една маса
1. Въведение в базата данни
2. Филтриране на WHERE редове. Регулярни изрази LIKE. И и ИЛИ
3. Сортиране на низове ORDER BY
4. Агрегиращи функции: COUNT, SUM, MIN, MAX, AVG. Псевдоними
5. Групиране на редове GROUP BY и HAVING. Генериране на справки
6. Практика на база резултатите от 1-ви модул
Операции върху множество таблици
1. Понятия за първичен ключ и външен ключ. Видове връзки в базата данни
2. Генериране на заявки от множество таблици. INNER JOIN и псевдоними
3. LEFT JOIN и други видове JOIN
4. Обединяване на множество маси с помощта на UNION и UNION ALL
5. Подзапитвания
6. Упражнение въз основа на резултатите от 2-ри модул
Допълнителни важни теми
1. CASE израз
2. Популярни функции за работа с низове
Практически задачи за затвърдяване на учебния материал
1. Прости запитвания
2. Сложни запитвания
3. Заключение
2. Python: Анализ на данни с Pandas
Анализиране на кадри с данни поотделно
1. Четене на данни от файлове
2. Експресно запознаване с данните
3. Изход на колона
4. Типове данни
5. Филтриране на редове
6. Регулярни изрази
7. Сортиране на низове
8. Агрегиращи функции
9. Групиране на редове
Анализ на множество свързани кадри с данни
1. Обединяване на a. к. присъединяване
2. Конкатенация
Допълнителен необходим модул
1. Работа с дати и часове
2. Пивотни таблици
3. Нови начини за създаване на кадри с данни
4. Категоризация на номиналните характеристики
5. Замяна на стойности в рамка с данни
6. Визуализация в панди
7. Нарязване
8. Заключение