Data Science - безплатен курс от School of Data Analysis, обучение 4 семестъра, дата 2 декември 2023 г.
разни / / December 05, 2023
За тези, които искат да поставят проблеми с помощта на анализ на данни, да предлагат решения и да оценяват тяхната ефективност не само в синтетичен експеримент, но и в реални условия.
Статистика, машинно обучение и работа с различни видове данни.
Данните са в основата на повечето модерни услуги и продукти, от приложения за прогнозиране на времето до самоуправляващи се автомобили. Data Scientist провежда експерименти, изгражда показатели, знае как да оптимизира работата на услугите и разбира къде са техните точки на растеж.
Всеки студент трябва да завърши успешно поне три курса през семестъра. Например, ако има две от тях в основната програма, тогава трябва да изберете един от специалните курсове.
Знанията се проверяват предимно чрез домашна работа – изпити и контролни се провеждат само по някои предмети.
Първи семестър
Задължителен
Алгоритми и структури от данни, част 1
01. Сложност и изчислителни модели. Анализ на счетоводните стойности (начало)
02. Анализ на счетоводните стойности (край)
03. Алгоритми за сортиране и бързо сортиране
04. Поредна статистика. Купища (начало)
05. Купища (край)
06.Хеширане
07.Дървета за търсене (началото)
08. Търсене на дървета (продължение)
09.Дървета за търсене (край). Система от несвързани множества
10. RMQ и LCA задачи
11.Структури от данни за геометрично търсене
12. Проблемът за динамичната свързаност в неориентиран граф
Език Python
01. Основи на езика (част 1)
02. Основи на езика (част 2)
03. Обектно-ориентирано програмиране
04. Обработка на грешки
05. Дизайн и тестване на код
06.Работа със струни
07.Модел с памет
08 Функционално програмиране
09. Преглед на библиотеката (част 1)
10. Преглед на библиотеката (част 2)
11. Паралелно изчисление в Python
12. Работа с обекти за напреднали
Машинно обучение, част 1
01.Основни понятия и примери за приложни задачи
02. Методи за метрична класификация
03. Методи за логическа класификация и дървета на решения
04. Градиентни линейни методи за класификация
05. Поддържаща векторна машина
06.Многомерна линейна регресия
07.Нелинейна и непараметрична регресия, нестандартни функции на загуби
08. Прогнозиране на времеви редове
09.Байесови методи за класификация
10. Логистична регресия
11. Търсене на правила за асоцииране
Втори срок
Задължителен
Основи на статистиката в машинното обучение
01.Въведение
02.Основни задачи и методи на теорията на статистическия извод
03. Оценка на разпределението и статистически функционали
04. Симулация на Монте Карло, първоначално зареждане
05. Параметрична оценка
06. Проверка на хипотези
07. Намаляване на размерността на многомерните данни
08.Оценка на чувствителността на модела
09.Линейна и логистична регресия
10. Методи за проектиране на експерименти
11. Различни видове регуляризация в линейната регресия
12. Нелинейни методи за конструиране на регресионни зависимости
13. Непараметрично оценяване
14.Байесов подход към оценката
15.Байесов подход към регресията
16. Байесов подход към регресията и оптимизацията
17.Използване на модела на произволно поле на Гаус в задачи за анализ на данни
18. Използване на статистически модели и методи при сурогатно моделиране и оптимизационни проблеми
Машинно обучение, част 2
01. Невронно-мрежови методи за класификация и регресия
02. Композиционни методи на класификация и регресия
03.Критерии за избор на модели и методи за избор на характеристики
04.Класиране
05. Учене за засилване
06.Учене без учител
07.Проблеми с частично обучение
08. Съвместно филтриране
09. Тематично моделиране
Трети семестър
Да избера от
Автоматична обработка на текст
01 Материал на курса
или
Компютърно зрение
Курсът е посветен на методите и алгоритмите на компютърното зрение, т.е. извличане на информация от изображения и видеоклипове. Нека да разгледаме основите на обработката на изображения, класификацията на изображенията, търсенето на изображения по съдържание, разпознаването на лица, сегментирането на изображенията. След това ще говорим за алгоритми за обработка и анализ на видео. Последната част от курса е посветена на 3D реконструкцията. За повечето проблеми ще обсъдим съществуващи модели на невронни мрежи. В курса се опитваме да обърнем внимание само на най-съвременните методи, които се използват в момента при решаване на практически и изследователски проблеми. Курсът е по-скоро практически, отколкото теоретичен. Поради това всички лекции са оборудвани с лабораторни и домашни, които ви позволяват да изпробвате повечето от разгледаните методи на практика. Работата се извършва в Python с помощта на различни библиотеки.
01.Цифрово изображение и тонална корекция.
02.Основи на обработката на изображения.
03.Комбиниране на изображения.
04. Класификация на изображения и търсене на подобни.
05. Конволюционни невронни мрежи за класификация и търсене на подобни изображения.
06.Откриване на обект.
07. Семантична сегментация.
08. Трансфер на стил и синтез на изображение.
09. Видео разпознаване.
10.Sparse 3D реконструкция.
11. Плътна триизмерна реконструкция.
12.Реконструкция от един кадър и облаци от точки, параметрични модели.
Четвърти семестър
Препоръчителни специални курсове
Дълбоко обучение
01.Курсови материали
Учене с подсилване
01.Курсови материали
Самоуправляващи се автомобили
Курсът обхваща основните компоненти на технологията за самостоятелно шофиране: локализация, възприятие, прогнозиране, ниво на поведение и планиране на движението. За всеки компонент ще бъдат описани основните подходи. Освен това студентите ще се запознаят с текущите пазарни условия и технологични предизвикателства.
01. Преглед на основните компоненти и сензори на безпилотен автомобил. Нива на автономност. Шофиране по кабел. Самоуправляващите се автомобили като бизнес продукт. Начини за оценка на напредъка в създаването на дронове. Основи на локализацията: gnss, колело одометрия, байесови филтри.
02.Методи за лидарна локализация: ICP, NDT, LOAM. Въведение във визуалния SLAM, използвайки ORB-SLAM като пример. Постановка на проблема GraphSLAM. Намаляване на проблема GraphSLAM до нелинеен метод на най-малките квадрати. Избор на правилната параметризация. Системи със специална структура в GraphSLAM. Архитектурен подход: фронтенд и бекенд.
03. Задача за разпознаване в самоуправляващ се автомобил. Статични и динамични препятствия. Сензори за системата за разпознаване. Представяне на статични препятствия. Откриване на статични препятствия с помощта на лидар (VSCAN, методи на невронни мрежи). Използване на lidar във връзка с изображения за откриване на статика (семантично сегментиране на изображението, завършване на дълбочина). Стерео камера и получаване на дълбочина от картината. Светът на Stixel.
04. Представяне на динамични препятствия в самоуправляваща се кола. Методи на невронни мрежи за откриване на обекти в 2D. Откриване въз основа на изглед от птичи поглед на лидарно представяне на облак. Използване на лидар с изображения за откриване на динамични препятствия. Откриване на автомобили в 3D на базата на снимки (3D монтаж на кутии, CAD модели). Радарно базирано динамично откриване на препятствия. Проследяване на обекти.
05. Модели на шофиране на автомобил: задно колело, предно колело. Планиране на пътя. Концепцията за конфигурационно пространство. Графични методи за построяване на траектории. Траектории, които минимизират друсането. Оптимизационни методи за построяване на траектории.
06. Планиране на скоростта в динамична среда. ST планиране. Прогнозиране на поведението на другите участници в движението.