Машинно обучение на практика - курс 41 500 rub. от IBS Training Center, обучение 24 часа, Дата 26 ноември 2023 г.
разни / / December 02, 2023
Курсът е изграден около няколко практически случая, съдържащи таблици с изходни данни.
За всеки случай преминаваме през пълния жизнен цикъл на проект за машинно обучение:
проучване, почистване и подготовка на данни,
избор на метод на обучение, подходящ за задачата (линейна регресия за регресия, произволна гора за класификация, K-средни стойности и DBSCAN за групиране),
обучение по избрания метод,
оценка на резултата,
оптимизация на модела,
представяне на резултата на клиента.
По време на дискусионната част на курса обсъждаме практически проблеми, пред които са изправени студентите, които могат да бъдат решени с помощта на обсъжданите методи.
Обхванати теми:
1. Преговор на задачата (теория – 1 час)
Какви проблеми се решават добре чрез машинно обучение и какви проблеми се опитват да решат?
Какво се случва, ако вместо Data Scientist наемете неспециалист в областта (само разработчик/аналитик/мениджър) с очакването, че той ще се научи в процеса.
2. Подготовка, почистване, проучване на данни (теория – 1 час, практика – 1 час)
Как да разберете изходните бизнес данни (и като цяло да откриете всякакъв ред в тях).
Последователност на обработка.
Какво може и трябва да бъде делегирано на анализаторите на домейни и какво е най-добре да направи самият Data Scientist.
Приоритети за решаване на конкретен проблем.
3. Класификатори и регресори (теория – 2 часа, практика – 2 часа)
Практически раздел - добре формализирани задачи с подготвени данни.
Разлика между задачите (двоична/недвоична/вероятностна класификация, регресия), преразпределение на задачите между класовете.
Примери за класификация на практически задачи.
4. Клъстеризиране (теория – 1 час, практика – 2 часа)
Къде и как да се извърши клъстеризиране: изследване на данни, проверка на постановката на проблема, проверка на резултатите.
Какви случаи могат да бъдат сведени до групиране.
5. Оценка на модела (теория – 1 час, практика – 1 час)
Бизнес показатели и технически показатели.
Метрики за проблеми с класификация и регресия, матрица на грешките.
Вътрешни и външни показатели за качество на клъстерирането.
Кръстосано валидиране.
Оценяване на преквалификацията.
6. Оптимизация (теория – 5 часа, практика – 3 часа)
Какво прави един модел по-добър от друг: параметри, характеристики, ансамбли.
Управление на настройките.
Практика за избор на функции.
Преглед на инструменти за намиране на най-добрите параметри, характеристики и методи.
7. Графики, отчети, работа с реални задачи (теория – 2 часа, практика – 2 часа)
Как ясно да обясните какво се случва: на себе си, на екипа, на клиента.
Още красиви отговори на безсмислени въпроси.
Как да представим три терабайта резултати на един слайд.
Полуавтоматични тестове, кои контролни точки на процеса наистина са необходими.
От задачи на живо до пълен R&D процес (“R&D на практика”) - анализ и анализ на задачите от публиката.