1. Агрегація даних

 1. Мета роботи

Навчитися агрегувати дані для наступної аналітики.

 1. Порядок виконання роботи і методичні вказівки з її виконання

 1. Завантажити користувальницькі дані  до реляційної БД. Дані представлені у форматі JSON з наступною схемою

[

        {

                ‘user_id’: guid,

                ‘time’: date,

                ‘event_id’: number,

                parameters: [

        ‘key1’: val1,

        ‘key2’: val2,

        ….

]

},

{....}]

Параметральна документація наведена нижче:

Таблиця 1.1 – Параметральна документація

event_id

Подія

Параметер1

Параметер2

Параметер3

Параметер4

1

Запуск гри

2

Перший запуск гри

Стать
(gender [string])

Вік
(age [int])

Країна*
(country [string])

3

Початок етапу

Етап

(stage [number])

4

Завершення етапу

Етап

(stage [number])

Перемога
(win [bool])

Час (секунд)

(time [number])

Здобуто валюти*
(income [number])

5

Покупка внутрішньоігрового предмета

Назва предмета

(item [string])

Кошт (внутрішньоігровий)

(price [number])

6

Покупка валюти

Назва паку

(name][string])

Кошт (USD) (price [decimal])

Здобуто валюти
(income
[number])

Параметри помічені зірочкою можуть бути відсутні.

 1. При завантажені даних нормалізувати їх та забезпечити можливість шардингу.
 1. Побудувати таблиці, що містять наступні загреговані значення на кожен день врахуйте, що дані є семпловані, тобто ми взяли 10% даних, що є рівномірно розподілені за користувачамі:

 1. Зміст звіту

 1. Схема БД, що буде побудована.
 2. Програмний код ETL та агрегуючої систем
 3. Загреговані таблиці
 4. Висновки.

 1. Контрольні запитання і завдання

 1. Які основні проблеми у систем агрегації?
 2. Опишіть базовий принцип агрегації даних.
 3. Що таке ETL-система?
 4. Навіщо використовуються ETL-системи?
 5. Що відбувається на етапі вилучення даних?
 6. Що відбувається на етапі переробки даних?
 7. Що відбувається на етапі завантаження даних?

 1. Прогнозування даних

 1. Мета роботи

Навчитись прогнузувати дані використовуючи методи лінійної регресі

 1. Порядок виконання лабораторної роботи

 1. Спрогнозувати наступні параметри на наступні півроку

 1. Зміст звіту

 1. Розроблені математичні моделі.
 2. Графіки з даними, що було спрогнозовано.
 3. Висновки.

 1. Контрольні запитання і завдання

 1. Що таке ММ?
 2. Які параметри ОД впливають на ММ?
 3. Як виокремити ступінь впливу параметра ОД на ММ?
 4. Навіщо потрібні регресійні моделі?
 5. Як побудувати регресійну модель?
 6. Що таке лінійна регресія?

 1. Сегментація користувачів

 1. Мета роботи

Розробити користувачів за групами, що мають схожі поведінкові ознаки.

 1. Порядок виконання лабораторної роботи

 1. Розбити користувачів за наступними сегментами
 1. Перерахувати загреговані значення за кожним сегментом
 2. Зпрогнозувати параметри з лабораторної 2 по кожному сегменту

 1. Зміст звіту

 1. Математична модель, що використовувалась для кластеризації.
 2. Отримані кластери.
 3. Висновки.

 1. Контрольні запитання і завдання

 1. Що таке алгоритм кластеризації?
 2. Що таке кластеризація?
 3. Чим кластеризація відрізняється від класифікації?
 4. Які проблеми мають алгоритми кластеризації?
 5. Як працює алгоритм k-means?
 1. Візуалізація даних

 1. Мета роботи

Створити наочні уявлення аналітичних даних.

 1. Порядок виконання лабораторної роботи

 1. Побудувати графіки, що містять:

 1. Зміст звіту

 1. Книга Power BI.
 2. Зображення графіків, що було побудовано.
 3. Висновки.

 1. Контрольні запитання і завдання

 1.  Які приклади візуалізації ви знаєте?
 2. Коли використовуються кільцеві діграми?
 3. Коли використовуються воронки?
 4. Коли використовуються мапи?
 5. Які гарні приклади створення візуалізацій ви знаєте?

 1. Формування звітів

 1. Мета роботи

Розробити звіти, що можуть бути використані для ігрового аналізу.

 1. Порядок виконання лабораторної роботи

 1. Побудувати звіт у програмі Power BI. Кожна сторінка має містити таблицю та графік з даними. Забезпечити можливість фільтрації даних за довільними когортами та датами. Звіт має містити наступні сторінки:

 1. Зміст звіту

 1. Зроблений звіт.
 2. Скріншоти сторінок звіту.
 3. Висновки.

 1. Контрольні запитання і завдання

 1. Які вимоги до макету звіту?
 2. Навіщо вирівнювати звіт?
 3. Як впливає переповнення звіту інформацією на користувача?
 4. Як користувач сприймає звіт?
 5. Які вимоги до кольорів звіту?