1 of 10

Вебсистема для побудови та аналізу OLAP-кубів CubeApp

студентка гр. ПЗПІз-22-1 Тимченко Є. Г.

Керівник: ст.викл. каф. ПІ Широкопетлєва М.С.

Харківський національний університет радіоелектроніки

2 of 10

Актуальність роботи і задачі

2

Задачі проєкту:

1. Автоматичний аналіз придатності даних для OLAP

2. Побудова OLAP-кубів з підтримкою часових ієрархій та кастомних мір

3. Виконання SQL/MDX запитів з AI-генерацією через Gemini

4. Створення інтерактивних дашбордів з експортом у PDF

5. Управління проєктами, користувачами та адміністрування

Час розробки:

01.10.2025 – 10.03.2026

Існуючі OLAP-рішення (Microsoft SSAS, Apache Kylin, Mondrian) потребують значних зусиль для розгортання та конфігурації.

Бізнес-аналітикам і менеджерам потрібен інструмент, що працює за принципом "завантажив файл → отримав куб → побудував дашборд" — без DevOps і DBA.

3 of 10

Ролі користувачів.

Use-Case діаграма (Гість)

3

Use-Case діаграма (Адміністратор)

4 of 10

Use-Case діаграма (Користувач)

3

5 of 10

Алгоритм визначення придатності до OLAP аналізу

5

Фактори, що аналізуються

Виміри (Dimensions)

Категоріальні поля з прийнятною кардинальністю.�Оцінка: null-частка, унікальність, семантика (ID/дата/категорія).

Міри (Measures)

Числові поля, придатні для агрегації.�Оцінка: дисперсія, виброси, нулі, діапазон значень.

Часові поля (Temporal)

Автоматичне виявлення дат та побудова ієрархій:�Year → Quarter → Month → Day.

Датасет придатний до OLAP аналізу, якщо:

✓ ≥ 1 «якісний» вимір (final_score ≥ 0.7)

✓ ≥ 1 «якісна» міра (final_score ≥ 0.7)

✓ Інтегральний показник якості ≥ 0.4

✓ Кількість рядків ≥ 2

Інтегральний показник:

overall_score = 0.5 × avg(dim_scores) + 0.5 × avg(measure_scores)

Альтернатива: �якщо розширений аналіз недоступний – проста перевірка наявності числових і нечислових колонок.

6 of 10

Діаграма активності – аналіз якості даних

6

7 of 10

Архітектура системи

Клієнт-серверна архітектура з розгортанням через Docker Compose.

7

8 of 10

Використані технології

8

Серверна частина (Backend)

Клієнтська частина (Frontend)

9 of 10

Діаграма послідовності – AI-генерація запитів

9

10 of 10

Висновки та перспективи розвитку

10

Висновки:

Розроблено вебсистему для побудови та аналізу OLAP-кубів, що реалізує повний цикл: від завантаження табличних даних до побудови OLAP-кубів, виконання SQL/MDX запитів та візуалізації результатів на дашбордах.

�Реалізовано алгоритм автоматичного аналізу придатності датасетів для побудови кубів з багатофакторною оцінкою вимірів та мір.

�Інтегровано AI-генерацію запитів через Gemini API з валідацією та авторепарацією згенерованих SQL/MDX запитів.

�Результати проєкту можуть бути використані бізнес-аналітиками, аналітиками даних та менеджерами для оперативного аналізу даних без потреби у складній інфраструктурі та для навчання дата-інженерів.

Перспективи розвитку:

→ Підключення зовнішніх баз даних як джерел

→ Інтеграція з хмарними сховищами (S3, GCS)

→ Підтримка Parquet та інших форматів

→ Мобільний додаток

→ Повноцінна RBAC-система ролей

→ Вбудований ML/AI-аналізатор для прогнозування

→ Публічне API для інтеграції з BI-платформами

→ Стрімінгові джерела даних

Посилання на відео: https://youtu.be/g3zpiV8PiWc