Василь
Нестеренко
Курс “Аналітика даних” складається з 5-х основних блоків
Що таке аналітика
Аналіз це — дослідження елементів та аспектів цілого для отримання змістовних висновків. Можна аналізувати що завгодно — вираз обличчя, зміст літератури, політику.
Але на цьому курсі ми обмежимось аналітикою даних для бізнесу. Тобто дослідження аспектів підприємства, зазвичай, з метою підвищення ефективності.
Прийняття рішень на основі даних
Основна задача аналітика - це забезпечити можливість прийняття рішень на основі даних (Data-driven decision-making або DDDM).
Які рішення ми приймаємо?
Але що ми аналізуємо?
З розвитком компʼютерів, за останні десятиріччя, почало зʼявлятися дуже багато даних:
Майже все, що ти робиш онлайн, записується в бази даних:
Дані
Дані — це набір інформації, який зашифрований для зберігання та зчитування.
Наприклад, текст та зображення з цієї презентації є даними, але коли ти його читаєш, то з тексту ти отримуєш інформацію.
Якими бувають дані?
Як ми зберігаємо дані для аналізу?
Structured data
Structured data - те, з чим зазвичай працюють аналітики.
Structured data - це, зазвичай, бази даних.
Semi-Structured data
Це файли, котрі ми можемо імпортувати в базу даних.
У файлів є певна структура, але вона:
а) не є фіксованою
б) може бути порушена.
CSV
CSV - формат, в котрому зберігають дані з таблиць.
JSON
JSON - це й тип даних, й формат файлу одночасно.
Data Lake
Data Lake - це місце, де зберігається semi-structured та unstructured data. Тобто, де зберігаються файли. Це - щось накшталт Google Drive чи Dropbox для аналітиків та розробників.
Зазвичай, з Data Lake дані потрапляють в Data Warehouse.
Типи даних
Google Sheets
Google Sheets - це застосунок для роботи з таблицями.
Дуже схожий на Excel. Це - майже Excel онлайн.
Чому всі використовують Google Sheets