Основи на хранилищата за данни - курс 44 500 rub. от IBS Training Center, обучение 24 часа, Дата 26 ноември 2023 г.
разни / / November 30, 2023
По време на курса ще се запознаете с основните концепции и предизвикателствата, които възникват при създаването на хранилища за данни. Разберете как целите влияят върху избора на архитектура и какви последствия могат да произтекат от недостатъчно внимание към компонентите. Получете представа за ролите и влиянието на членовете на екипа върху резултата. Програмата на курса ще опише практически подходи към проектирането и внедряването на хранилища за данни и техните компоненти. Ще разгледате управлението на жизнения цикъл, включително извеждане от експлоатация и миграция към нови системи, и ще покриете теми за управление на данни и изграждане на услуги въз основа на него. В практическата част студентите ще бъдат разделени на два екипа: единият от екипите ще работи по проект за миграция на съхранение данни, като се вземат предвид стратегическите цели за развитие на предприятието, а вторият ще го оцени по отношение на способности, ресурси и крайни срокове.
Обхванати теми:
1. Въведение (теория + практика 2,5 часа).
Концепцията за „склад за данни“. Неговите възможности и ограничения
Защо е създаден DWH, какъв бизнес проблем решава?
2. Компоненти и архитектура (теория + практика 3 часа).
Класически подходи за проектиране на хранилища за данни
Включени типични компоненти и процеси
Концепции Inmon, Kimball и DataVault
Преглед на основните компоненти (етап, ods, dds, datamart, bi, метаданни) и процеси (ETL, ELT, DQ, lineage)
3. Управление на данни - Data Governance (теория + практика 2 часа).
Общи и специфични въпроси на управлението на корпоративни данни
Информацията се разглежда като актив, който носи стойност и има разходи за получаване.
Понятието „основни данни” и системи за тяхното управление – MDM
4. Техники за проектиране на съхранение (теория + практика 5 часа).
Стъпки за проектиране на съхранение
Типични техники и инструменти за създаване
Експертиза на участниците и инфраструктурата
5. Зона за съхранение на изходни данни - Сцена (теория + практика 3 часа).
Необходимостта от съхраняване на необработени данни от изходната система
Типични грешки при организирането на тази зона и нейната разлика от „езеро с данни“
6. Зони за постоянно съхранение - ODS и DDS (теория + практика 3 часа).
Оперативни и многомерни слоеве за съхранение на данни
Процеси на извличане, пречистване, контрол и консервиране - ETL\ELT
Трансформация към схема за целево съхранение
7. Системи за съхранение на данни (теория + практика 3,5 часа).
Типични сценарии за използване на данни от хранилища
Основни потребители - системи за бизнес разузнаване "BI"
Структурата на една типична BI система и причините за голямото им разнообразие
8. Нови предизвикателства при разработването на хранилища за данни (теория + практика 2 часа).
Преглед на основните предизвикателства, пред които са изправени складовите съоръжения, докато растат
Нови предизвикателства в машинното обучение
Концепцията Data Mesh като алтернатива за по-нататъшно развитие.