Data Scientist от нулата до PRO - курс 233 640 RUB. от SkillFactory, обучение 24 месеца, дата 15 август 2023 г.
разни / / November 29, 2023
След основния курс ще можете да изберете по-тясна специализация в Data Science - ML инженер, CV инженер или NLP инженер
M.L. инженер — Разработчик на машинно обучение
Разработете модел за прогнозиране на кредитния рейтинг
Решете проблема с класифицирането на спам SMS съобщения
Разработете система за препоръчване на подходящи продукти при покупка
Изградете модел за увеличаване на продажбите в търговията на дребно
Създавайте изображения въз основа на текстово описание с помощта на невронната мрежа DALL-E
CV инженер — Специалист по компютърно зрение
Научете се да решавате всички основни проблеми в областта на компютърното зрение
Ще придобиете познания за реалния поток на работа с CV модели, съвременни подходи и усъвършенствани инструменти, необходими за създаване на CV услуги
Във финалния проект създайте виртуален треньор, способен да оценява правилността на упражненията на видео
НЛП инженер — Специалист по обработка на естествен език
Запознайте се с обработката на естествен език
Разберете задачите на НЛП - класифициране, обобщаване и генериране на текст, създаване на системи за машинен превод и системи за отговори на въпроси
Във финалния проект ще разработите самостоятелно инструменти за автоматизирано търсене на контексти по зададени теми.
БАЗА
На този етап ще научите основите на програмирането в Python, ще научите как да обработвате предварително и анализирате данни, а също така ще се запознаете с основните задачи на специалиста по данни.
Въведение - 1 седмица
Ще можете да формулирате реални учебни цели за себе си, да разберете каква е стойността на DS за бизнеса, запознайте се с основните задачи на специалиста по данни и разберете как разработването на всяка Проект на ДС.
ВЪВЕДЕНИЕ-1. Как да учим ефективно – onboarding in training
ВЪВЕДЕНИЕ-2. Преглед на професията. Видове проблеми в Data Science. Етапи и подходи за разработване на проект за Data Science
Развойно проектиране - 5 седмици
Ще се научите да работите с основни типове данни с помощта на Python и ще можете да използвате циклични конструкции, условни изрази и функции в ежедневната си работа.
PYTHON-1. Основи на Python
PYTHON-2. Гмуркане в типовете данни
PYTHON-3. Условни твърдения
PYTHON-4. Цикли
PYTHON-5. Функции и функционално програмиране
PYTHON-6. Практикувайте
PYTHON-7. Ръководство за стил на Python (бонус)
Основи на математиката - 7 седмици
МАТЕМАТИКА-1. Числа и изрази
МАТЕМАТИКА-2. Уравнения и неравенства
МАТЕМАТИКА-3. Основни понятия на теорията на функциите
МАТЕМАТИКА-4. Основи на геометрията: планиметрия, тригонометрия и стереометрия
МАТЕМАТИКА-5. Набори, логика и елементи на статистиката
МАТЕМАТИКА-6. Комбинаторика и основи на теорията на вероятностите
МАТЕМАТИКА-7. Разрешаване на проблем
Работа с данни - 8 седмици
На този етап ще овладеете основни умения за данни: как да подготвите, почистите и трансформирате данни, така че да са подходящи за анализ. Говорейки за анализ: ще анализирате данни с помощта на популярните библиотеки Matplotlib, Seaborn, Plotly.
PYTHON-8. Инструменти за наука за данни
PYTHON-9. Библиотека NumPy
PYTHON-10. Въведение в Пандите
PYTHON-11. Основни техники за работа с данни в Pandas
PYTHON-12. Усъвършенствани техники за данни в Pandas
PYTHON-13. Почистване на данни
PYTHON-14. Визуализация на данни
PYTHON-15. Принципи на ООП в Python и код за отстраняване на грешки (опционален модул)
Проект 1. Анализ на набор от данни по затворени въпроси
Зареждане на данни - 6 седмици
Ще можете да изтегляте данни от различни формати и източници. И SQL, структуриран език за заявки, ще ви помогне с това. Ще се научите да използвате агрегатни функции, съединения на таблици и сложни съединения.
PYTHON-16. Как да изтеглите данни от файлове с различни формати
PYTHON-17. Извличане на данни от уеб източници и API
SQL-0. Здравей SQL!
SQL-1. Основи на SQL
SQL-2. Агрегатни функции
SQL-3. Съединяване на маси
SQL-4. Сложни съединения
Проект 2. Зареждат се нови данни. Прецизиране на анализа
Статистически анализ на данни - 7 седмици
Анализът на разузнавателните данни (EDA) е това, което ще бъде вашият фокус. Ще се запознаете с всички етапи на такъв анализ и ще научите как да го провеждате с помощта на библиотеките Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. Освен това ще можете да работите върху Kaggle, популярна услуга за участие в състезания.
EDA-1. Въведение в анализа на разузнавателни данни. Алгоритми и методи на EDA
ЕДА-2. Математическа статистика в контекста на EDA. Видове функции
EDA-3. Инженеринг на характеристиките
EDA-4. Анализ на статистически данни в Python
EDA-5. Анализ на статистически данни в Python. Част 2
ЕДА-6. Проектиране на експерименти
EDA-7. Платформа Kaggle
Проект 2
Въведение в машинното обучение – 9 седмици
Ще се запознаете с ML библиотеките за моделиране на зависимости от данни. Ще можете да обучавате основните типове ML модели, да извършвате валидиране, да интерпретирате резултатите от работата и да избирате важни характеристики (feature important).
ML-1. Теория за машинно обучение
ML-2. Обучение под надзор: регресия
ML-3. Обучение под надзор: Класификация
ML-4. Неконтролирано обучение: Групиране и техники за намаляване на размерността
ML-5. Валидиране на данни и оценка на модела
ML-6. Подбор и подбор на белези
ML-7. Оптимизиране на хиперпараметрите на модела
ML-8. ML Готварска книга
Проект 3. Проблем с класификацията
ГЛАВНА ЕДИНИЦА
Линейна алгебра, математически анализ, дискретна математика - звучи страшно, но не се плашете: ние ще анализираме всички тези теми и ще ви научим как да работите с тях! Във втория етап ще се потопите в математиката и основите на машинното обучение, ще научите повече за DS професиите и чрез кариерно ориентиране ще изберете втора година на обучение.
Математика и машинно обучение. Част 1 - 6 седмици
Ще можете да решавате практически задачи с помощта на ръчно изчисление и Python (векторни и матрични изчисления, работа с множества, изучаване на функции с помощта на диференциален анализ).
МАТЕМАТИКА&ML-1. Линейна алгебра в контекста на линейните методи. Част 1
МАТЕМАТИКА&ML-2. Линейна алгебра в контекста на линейните методи. Част 2
МАТЕМАТИКА&ML-3. Математически анализ в контекста на задача за оптимизация Част 1
МАТЕМАТИКА&ML-4. Математически анализ в контекста на оптимизационен проблем. Част 2
МАТЕМАТИКА&ML-5. Математически анализ в контекста на оптимизационен проблем. Част 3
Проект 4. Проблем с регресията
Математика и машинно обучение. Част 2 - 6 седмици
Ще се запознаете с основните понятия на теорията на вероятностите и математическата статистика, алгоритмите клъстериране, както и да се научите да оценявате качеството на извършеното клъстериране и да представяте резултатите в него графична форма.
МАТЕМАТИКА&ML-6. Теория на вероятностите в контекста на наивен байесов класификатор
МАТЕМАТИКА&ML-7. Алгоритми, базирани на дървета на решенията
МАТЕМАТИКА&ML-8. Подсилване и подреждане
МАТЕМАТИКА&ML-9. Техники за групиране и намаляване на размерността. Част 1
МАТЕМАТИКА&ML-10. Техники за групиране и намаляване на размерността. Част 2
Проект 5. Ансамбълни методи
Дискретна математика – 4 седмици
MATH&MGU-1 Множества и комбинаторика
MATH&MGU-2 Логика
MATH&MGU-3 Графики. Част 1
MATH&MGU-4 Графики. Част 2
ML в бизнеса - 8 седмици
Ще се научите да използвате ML библиотеки за решаване на проблеми с времеви серии и препоръчителни системи. Ще можете да обучите ML модел и да го валидирате, както и да създадете работещ прототип и да стартирате модела в уеб интерфейса. И също така придобийте умения за A/B тестване, за да можете да оцените модела.
МАТЕМАТИКА&ML-11. Времеви редове. Част 1
МАТЕМАТИКА&ML-12. Времеви редове. Част 2
МАТЕМАТИКА&ML-13. Системи за препоръчване. Част 1
МАТЕМАТИКА&ML-14. Системи за препоръчване. Част 2
ПРОД-1. Подготовка на модела за производство
ПРОД-2. ПрототипStreamlit+Heroku
ПРОД-3. Бизнес разбиране. Случай
Проект 6. Тема за избор: Времеви редове или системи за препоръчване
ПРОФЕСИОНАЛНО НИВО
В третия етап ще се запознаете с един от методите за машинно обучение – дълбоко обучение (DL). Освен това ви очаква пълноценен блок от избраната специализация: можете да овладеете умения за машинно обучение (ML), запознайте се с рутината на CV (компютърно зрение) или усъвършенствайте NLP*, естествена обработка език.
Втора година на обучение - 3 специалности по избор
Кариерно ориентиране
ML, CV или NLP: на този етап най-накрая трябва да направите избор по кой път да поемете. Ще ви разкажем за всяка специализация и ще ви предложим да решите няколко практически задачи, за да ви улесним при вземането на решение.
Писта ML - инженер
В курса ML ще се научите да решавате задълбочени проблеми с машинното обучение, ще овладеете компетенциите на инженер по данни и ще усъвършенствате уменията си за работа с библиотеки на Python. Освен това ще научите как да създадете MVP (минимална жизнеспособна версия на продукт), ще научите всички тънкости на извеждането на ML модел в производството и ще научите как ML инженерите работят в реалния живот.
Въведение в дълбокото обучение
Основи на инженеринга на данни
Допълнителни глави за Python и ML
Икономическа оценка на ефектите и развитие на MVP
ML към производството
Задълбочено изучаване на ML развитие и дипломен проект по избрана тема
Проследете CV - инженер
На пистата за CV ще се научите да решавате проблеми с компютърното зрение като класифициране на изображения, сегментиране и откриване, генериране и стилизиране на изображения, възстановяване и подобряване на качеството снимки. Освен това ще научите как да внедрявате невронни мрежи в производство.
Въведение в дълбокото обучение
Основи на инженеринга на данни
Допълнителни глави за Python и ML
Икономическа оценка на ефектите и развитие на MVP
ML към производството
Задълбочено изучаване на ML развитие и дипломен проект по избрана тема
Писта НЛП - инженер
По време на обучението по NLP трасето ще научите как да решавате основните проблеми на обработката на естествения език, в включително класификация, обобщение и генериране на текст, машинен превод и създаване на диалог системи
Въведение в дълбокото обучение
Математика на невронни мрежи за НЛП
Хардуер и софтуер за решаване на НЛП проблеми
НЛП задачи и алгоритми
Невронни мрежи в производството
Задълбочено изучаване на НЛП развитие и дипломен проект по избрана тема
Ако изберете CV или ML специализация, можете да вземете курса по НЛП без менторска подкрепа безплатно.
Дълбоко обучение и невронни мрежи
Къде се използват невронните мрежи? Как да обучаваме невронна мрежа? Какво е Deep Learning? Отговорите на тези въпроси ще откриете в секцията за бонуси на DL.
Въведение в Data Engineering
Ще научите каква е разликата между ролите на data scientist и data engineer, какви инструменти използва последният в работата си и какви задачи решава ежедневно. Думите "снежинка", "звезда" и "езеро" ще придобият нови значения :)