Вебсистема для побудови та аналізу OLAP-кубів CubeApp
студентка гр. ПЗПІз-22-1 Тимченко Є. Г.
Керівник: ст.викл. каф. ПІ Широкопетлєва М.С.
Харківський національний університет радіоелектроніки
Актуальність роботи і задачі
2
Задачі проєкту:
1. Автоматичний аналіз придатності даних для OLAP
2. Побудова OLAP-кубів з підтримкою часових ієрархій та кастомних мір
3. Виконання SQL/MDX запитів з AI-генерацією через Gemini
4. Створення інтерактивних дашбордів з експортом у PDF
5. Управління проєктами, користувачами та адміністрування
Час розробки:
01.10.2025 – 10.03.2026
Існуючі OLAP-рішення (Microsoft SSAS, Apache Kylin, Mondrian) потребують значних зусиль для розгортання та конфігурації.
Бізнес-аналітикам і менеджерам потрібен інструмент, що працює за принципом "завантажив файл → отримав куб → побудував дашборд" — без DevOps і DBA.
Ролі користувачів.
Use-Case діаграма (Гість)
3
Use-Case діаграма (Адміністратор)
Use-Case діаграма (Користувач)
3
Алгоритм визначення придатності до OLAP аналізу
5
Фактори, що аналізуються
Виміри (Dimensions)
Категоріальні поля з прийнятною кардинальністю.�Оцінка: null-частка, унікальність, семантика (ID/дата/категорія).
Міри (Measures)
Числові поля, придатні для агрегації.�Оцінка: дисперсія, виброси, нулі, діапазон значень.
Часові поля (Temporal)
Автоматичне виявлення дат та побудова ієрархій:�Year → Quarter → Month → Day.
Датасет придатний до OLAP аналізу, якщо:
✓ ≥ 1 «якісний» вимір (final_score ≥ 0.7)
✓ ≥ 1 «якісна» міра (final_score ≥ 0.7)
✓ Інтегральний показник якості ≥ 0.4
✓ Кількість рядків ≥ 2
Інтегральний показник:
overall_score = 0.5 × avg(dim_scores) + 0.5 × avg(measure_scores)
Альтернатива: �якщо розширений аналіз недоступний – проста перевірка наявності числових і нечислових колонок.
Діаграма активності – аналіз якості даних
6
Архітектура системи
Клієнт-серверна архітектура з розгортанням через Docker Compose.
7
Використані технології
8
Серверна частина (Backend)
Клієнтська частина (Frontend)
Діаграма послідовності – AI-генерація запитів
9
Висновки та перспективи розвитку
10
Висновки:
Розроблено вебсистему для побудови та аналізу OLAP-кубів, що реалізує повний цикл: від завантаження табличних даних до побудови OLAP-кубів, виконання SQL/MDX запитів та візуалізації результатів на дашбордах.
�Реалізовано алгоритм автоматичного аналізу придатності датасетів для побудови кубів з багатофакторною оцінкою вимірів та мір.
�Інтегровано AI-генерацію запитів через Gemini API з валідацією та авторепарацією згенерованих SQL/MDX запитів.
�Результати проєкту можуть бути використані бізнес-аналітиками, аналітиками даних та менеджерами для оперативного аналізу даних без потреби у складній інфраструктурі та для навчання дата-інженерів.
Перспективи розвитку:
→ Підключення зовнішніх баз даних як джерел
→ Інтеграція з хмарними сховищами (S3, GCS)
→ Підтримка Parquet та інших форматів
→ Мобільний додаток
→ Повноцінна RBAC-система ролей
→ Вбудований ML/AI-аналізатор для прогнозування
→ Публічне API для інтеграції з BI-платформами
→ Стрімінгові джерела даних
Посилання на відео: https://youtu.be/g3zpiV8PiWc