Съвременни подходи за управление на данни - курс 27 900 RUB. от IBS Training Center, обучение 16 часа, Дата 26 ноември 2023 г.
разни / / December 02, 2023
Когато проектирате приложения, едно от важните решения е как да съхранявате данни. В продължение на няколко десетилетия релационните СУБД бяха първата и единствена опция; проектите се различаваха само по степента на нормализиране, местоположението на бизнес логиката и т.н. Последните десет до петнадесет години алтернативните системи процъфтяват бързо - от обектно-ориентирани и ориентирани към документи СУБД до разпределени файлови системи и системи за обработка на потоци данни. Курсът разглежда набор от съвременни решения, които позволяват дългосрочно сигурно съхранение на данни, причини за възникването на решения от различни класове, техните предимства, недостатъци и предпочитани методи използване.
Обхванати теми:
1. Еволюция на подходите за съхранение на данни (теория – 2 часа).
Бази данни, хранилища за данни, машини за бази данни, масивни паралелни архитектури, хиперконвергенция.
2. Релационен модел (теория – 2 часа).
Какви проблеми решава и на каква цена?
Репликация, шардинг, разпределени транзакции.
3. Минимален модел Key-Value (теория – 1 час, практика – 1 час).
Ключови структурни опции, стойностни структурни опции, софтуерни интерфейси.
Ефективност на използването на нерелационни бази данни: необходими и достатъчни условия [Cassandra, HBase].
4. Документно-ориентиран модел [MongoDB] (теория – 0,5 часа, практика – 0,5 часа).
5. Разпределени файлови системи вместо модели на данни: клъстерна архитектура [HDFS] (теория - 1 час, практика - 1 час).
6. SQL върху разпределени файлови системи (теория – 1 час, практика – 2 часа).
Опции за архитектура, файлови формати, ограничения, транзакции [Hive, Spark, Spark SQL, Parquet, ORC].
7. Разпределени системи за съхранение на данни в RAM [Hazelcast, Ignite, Tarantool] (теория – 1 час).
8. Разпределени OLAP системи [Clickhouse, Druid] (теория – 1 час).
9. Обработка на потоци от данни [Spark Streaming] (теоретично – 1 час).
10. Самоконфигуриращи се и автономни бази данни (теория – 1 час).