Машинно обучение за големи данни - безплатен курс от Open Education, обучение 5 седмици, от 5 до 14 часа седмично, Дата: 3 декември 2023 г.
разни / / December 08, 2023
Позиция: Crowd Solution Architect, Neatsy, Inc.
Започва работа във Висшето училище по икономика през 2017 г. Тя преподава курсове по дигитална грамотност, анализ на текст и инструменти и техники за работа с големи количества текстова информация. Професионални интереси: анализ на големи данни Образование 2018 Бакалавърска степен: Национален изследователски университет Висше училище по икономика, специалност "Приложна математика и компютърни науки"
1. Подготовка на данни за обучение
Днес машинното обучение работи ефективно, когато имаме големи количества етикетирани данни. Тази седмица ще разгледаме какви формати на данни и маркиране съществуват и как може да се събира това маркиране
2. Обучение на класически модели върху големи данни
Тази седмица ще научим как да обучаваме класически алгоритми (линейни модели и дървета на решения) върху големи данни.
3. Изграждане на препоръчителни системи
Ще разгледаме как можем да паралелизираме класическите алгоритми, използвани в системите за препоръки.
4. Анализ на големи обеми текстова информация
Нека разгледаме проблемите с машинното обучение върху текстове. Нека поговорим за предварителната обработка на текст и как да получите структурирано представяне на текстови данни с помощта на модели като word2vec и BERT.
5. Обучение на дълбоки невронни мрежи
Ще научим как да паралелизираме обучението на съвременните невронни мрежи, как Horovod и Parameter Server работят вътре и ще говорим за Transfer Learning.