Начальные шаги организации DQ в modern data stack
TALKING POINTS
О NabuMinds
Предоставляем data и CRM решения в области iGaming и e-Commerce
Около 50 человек в компании
20+ человек в Data team
Core data team – 6 человек
О себе
Lead Data Engineer��7+ лет в обработке данных
5 лет преподавал в ВУЗе
Почему dbt cloud
DBT Core
Compilation & Execution
Open source, deployment agnostic
DBT Cloud
UI, Identity & Statefullness
The most stable, reliable and collaborative way to develop & deploy dbt projects
Как все начиналось
Как все начиналось
Слои Хранилища
Идея
Архитектура AS IS
Работа с тестами
Monitoring
Notifications
Проблемы
Проблемы
Проблемы
Проблемы
Проблемы
Проблемы
Тесты писал не разработчик модели
Git, CI/CD
DE было больше, чем Data Qa�
Помимо dbt есть еще Tableau и Airflow�
Тест постоянно падает на конкретной строке, которую не планируют менять на источнике�
Тест постоянно падает на конкретной строке, которую не планируют менять на источнике�
Слак Алерты не очень информативны�
Слак Алерты не очень информативны�
Слак Алерты не очень информативны�
Тесты стали очень дорогими�
Тесты стали очень дорогими�
Тесты стали очень дорогими�
Тесты стали очень дорогими�
Тесты стали очень дорогими�
Тесты стали очень дорогими�
Тесты стали очень дорогими�
TODO
CI/CD�
THANK YOU!