1 of 17

Василь

Нестеренко

КОНТАКТНІ ДАНІ

Telegram:

https://t.me/Br_HeCToR

v.nesterenko@chnu.edu.ua

+380502830718

    • Доцент кафедри математичного аналізу
    • Data engineer at “Nimbus Web Inc”

2 of 17

Курс “Аналітика даних” складається з 5-х основних блоків

  1. Google Sheets . Основи статистики
  2. SQL. Маркетингова аналітика
  3. Візуалізація й прийняття рішення на основі аналізу даних. Продуктова аналітика
  4. Основи Пайтону для аналіза даних. A/B тести. Основи статистики й теорії ймовірності
  5. Автоматизація збору вимог

3 of 17

Що таке аналітика

Аналіз це — дослідження елементів та аспектів цілого для отримання змістовних висновків. Можна аналізувати що завгодно — вираз обличчя, зміст літератури, політику.

Але на цьому курсі ми обмежимось аналітикою даних для бізнесу. Тобто дослідження аспектів підприємства, зазвичай, з метою підвищення ефективності.

4 of 17

Прийняття рішень на основі даних

Основна задача аналітика - це забезпечити можливість прийняття рішень на основі даних (Data-driven decision-making або DDDM).

5 of 17

Які рішення ми приймаємо?

  • Дослідження реклами з метою зменшення витрат та збільшення продажів.
  • Дослідження роботи сейлз менеджерів з метою покращення роботи відділу продажів.
  • Дослідження поведінки користувачів на сайті для залучення та утримання клієнтів.

6 of 17

Але що ми аналізуємо?

З розвитком компʼютерів, за останні десятиріччя, почало зʼявлятися дуже багато даних:

  • Дані продажів
  • Бухгалтерська звітність
  • Елементи в наявності та на складах (Items in stock and in warehouses)
  • Записи в CRM (де сейлз-менеджери ведуть облік контактів з клієнтами)
  • Покази реклами в мережах реклами (ad networks)
  • Дані про відвідуваність сайту
  • тощо

Майже все, що ти робиш онлайн, записується в бази даних:

  • Переходи по сторінкам сайтів
  • Кліки по кнопках
  • Скрол сторінки
  • Заповнення форм, реєстрація
  • Перегляд відео
  • Всі дії в мобільному додатку
  • тощо

7 of 17

Дані

Дані — це набір інформації, який зашифрований для зберігання та зчитування.

Наприклад, текст та зображення з цієї презентації є даними, але коли ти його читаєш, то з тексту ти отримуєш інформацію.

8 of 17

Якими бувають дані?

  • Аналогові: картини, пластинки, надруковані книги, записи від руки, тощо.
  • Дискретні: ті, що зберігаються на носіях для їх зчитування комп'ютерами (або всередині комп'ютерів).

9 of 17

Як ми зберігаємо дані для аналізу?

  • Structured data - у вигляді таблиць
  • Semi-Structured data - у вигляді файлів з частково впорядкованими даними
  • Unstructured data - у вигляді будь-яких файлів

10 of 17

Structured data

Structured data - те, з чим зазвичай працюють аналітики.

Structured data - це, зазвичай, бази даних.

11 of 17

Semi-Structured data

Це файли, котрі ми можемо імпортувати в базу даних.

У файлів є певна структура, але вона:

а) не є фіксованою

б) може бути порушена.

12 of 17

CSV

CSV - формат, в котрому зберігають дані з таблиць.

13 of 17

JSON

JSON - це й тип даних, й формат файлу одночасно.

14 of 17

Data Lake

Data Lake - це місце, де зберігається semi-structured та unstructured data. Тобто, де зберігаються файли. Це - щось накшталт Google Drive чи Dropbox для аналітиків та розробників.

Зазвичай, з Data Lake дані потрапляють в Data Warehouse.

15 of 17

Типи даних

  • Числові: int, float
  • Текстові: char, string
  • Дата й час: date, datetime
  • Array
  • JSON

16 of 17

Google Sheets

Google Sheets - це застосунок для роботи з таблицями.

  • Безкоштовний для всіх
  • Дозволяє робити складні трансформації даних
  • Дозволяє будувати графіки

Дуже схожий на Excel. Це - майже Excel онлайн.

17 of 17

Чому всі використовують Google Sheets

  • Простий спосіб вести облік чому завгодно без використання спеціалізованого ПЗ
  • Найпростіший інструмент для аналізу даних для не-аналітиків