1 of 13

Основи статистичного аналізу даних. Візуалізація рядів і трендів даних

Викладач Олійник Н.М.

2 of 13

Аналіз даних

Аналіз даних - це процес збору та упорядкування даних з метою зробити з нього корисні висновки. 

Метою аналізу даних є знання про об’єкт дослідження — виявлення корисної інформації, знайдення висновків, врешті, розумне (зважене) прийняття рішень

3 of 13

4 типи аналізу

Описовий аналіз

Діагностичний аналіз

Інтелектуальний аналіз

Аналіз перспективний

4 of 13

Статистика

Статистичне дослідження складається з кількох етапів

Збирання даних

Обробка даних та подання у зручній формі

Аналіз даних

Висновки та рекомендації

Статистика - це галузь науки, яка займається збором, організацією, аналізом даних та виведенням висновків з вибірки для всієї сукупності.

5 of 13

Статистика

Дані для дослідження називають статистичними даними (вибіркою)

Дані з кожного рядка і стовпця таблиці вибірки утворюють ряди даних

Всю сукупність, з якої роблять вибірку називають генеральною

сукупністю. Число об’єктів генеральної сукупності і вибірки називають відповідно обсягом генеральної сукупності і обсягом вибірки.

Приклад . Якщо із 1000 деталей відібрано для обстеження 100

деталей, то обсяг генеральної сукупності N=1000, а обсяг вибірки n=100.

6 of 13

Характеристики вибірки

У статистичному аналізі опрацьовуються такі характеристики вибірки:

Обсяг вибірки

Розмах вибірки

Середнє арифметичне ряду чисел

Аналіз перспективний

Мода ряду чисел

Медіана

Частота

Стандартне відхилення

7 of 13

Статистика

8 of 13

Вибірка

Вибірка характеризується центральними тенденціями: середнім значенням, модою і медіаною.

Приклад

Середнім значенням вибірки називається середнє арифметичне всіх її значень.

Мода вибірки –значення вибірки, яке трапляється найчастіше.

Позначається Мо.

Медіа́на — це величина, що розташована в середині ряду величин, розташованих у зростаючому або спадному порядку

Середнє значення: (6+8+7+7++8+6+10+10+11+9)/10= 8,2

9 of 13

Вибірка

Вибірка характеризується центральними тенденціями: середнім значенням, модою і медіаною.

Приклад

Середнім значенням вибірки називається середнє арифметичне всіх її значень.

Мода вибірки –значення вибірки, яке трапляється найчастіше.

Позначається Мо.

Медіа́на — це величина, що розташована в середині ряду величин, розташованих у зростаючому або спадному порядку

мода: 7

10 of 13

Вибірка

Вибірка характеризується центральними тенденціями: середнім значенням, модою і медіаною.

Приклад

Середнім значенням вибірки називається середнє арифметичне всіх її значень.

Мода вибірки –значення вибірки, яке трапляється найчастіше.

Позначається Мо.

Медіа́на — це величина, що розташована в середині ряду величин, розташованих у зростаючому або спадному порядку

Медіана: В порядку зростання 6,7,7,7,8,8,9,10,10,11

M=(8+8)/2= 8

11 of 13

Візуалізація рядів даних

Для змістового навантаження графіка чи діаграми важливо правильно вибрати їх тип:

гістограма

Лінійна діаграма

кругова діаграма

12 of 13

Статистичні характеристики рядів даних

Характеристика

Означення

Функція MS Excel

Середнє арифметичне

Це частка від ділення суми цих чисел на їх кількість

AVERAGE (число1; число2;…)

Обсяг вибірки

Кількість елементів у вибірці

Count

Стандартне відхилення

Найпоширеніший показник розсіювання значень випадкової величини відносно середнього значення вибірки

STDEV.P

мода

Число яке найчастіше зустрічається у ряді даних

MODE.SNGL

медіана

Це величина, що розташована в середині ряду величин, розташованих у зростаючому або спадаючому порядку

MEDIAN

13 of 13

Підготувала Олійник Н.М.

Завдання

1 та 2 в зошиті, 3 і 4 на комп'ютері

1). Нехай дано вибірку 2,3,4,5,6,4,6,6,8,7,9,8. Знайти моду Мо, середнє значення вибірки, медіану Ме.

2). Нехай дано вибірку 11,12,17,15,14,15,13,13,11,17,13. Знайти моду Мо, середнє значення вибірки та медіану Ме.

3). В програмі MS Excel або Таблиці google скласти таблицю з ваших оцінок за попередній клас. Обчисліть середнє арифметичне, моду, медіану для цього ряду даних.

4). Провести статистичне дослідження серед своїх друзів: «Скільки часу проводять з мобільним телефоном». Для отриманих даних створити таблицю в програмі MS Excel або Таблиці Google, знайти середнє арифметичне, моду, медіану для цього ряду даних та побудувати гістограму