Основи статистичного аналізу даних. Візуалізація рядів і трендів даних
Викладач Олійник Н.М.
Аналіз даних
Аналіз даних - це процес збору та упорядкування даних з метою зробити з нього корисні висновки.
Метою аналізу даних є знання про об’єкт дослідження — виявлення корисної інформації, знайдення висновків, врешті, розумне (зважене) прийняття рішень
4 типи аналізу
Описовий аналіз
Діагностичний аналіз
Інтелектуальний аналіз
Аналіз перспективний
Статистика
Статистичне дослідження складається з кількох етапів
Збирання даних
Обробка даних та подання у зручній формі
Аналіз даних
Висновки та рекомендації
Статистика - це галузь науки, яка займається збором, організацією, аналізом даних та виведенням висновків з вибірки для всієї сукупності.
Статистика
Дані для дослідження називають статистичними даними (вибіркою)
Дані з кожного рядка і стовпця таблиці вибірки утворюють ряди даних
Всю сукупність, з якої роблять вибірку називають генеральною
сукупністю. Число об’єктів генеральної сукупності і вибірки називають відповідно обсягом генеральної сукупності і обсягом вибірки.
Приклад . Якщо із 1000 деталей відібрано для обстеження 100
деталей, то обсяг генеральної сукупності N=1000, а обсяг вибірки n=100.
Характеристики вибірки
У статистичному аналізі опрацьовуються такі характеристики вибірки:
Обсяг вибірки
Розмах вибірки
Середнє арифметичне ряду чисел
Аналіз перспективний
Мода ряду чисел
Медіана
Частота
Стандартне відхилення
Статистика
Вибірка
Вибірка характеризується центральними тенденціями: середнім значенням, модою і медіаною.
Приклад
Середнім значенням вибірки називається середнє арифметичне всіх її значень.
Мода вибірки –значення вибірки, яке трапляється найчастіше.
Позначається Мо.
Медіа́на — це величина, що розташована в середині ряду величин, розташованих у зростаючому або спадному порядку
Середнє значення: (6+8+7+7++8+6+10+10+11+9)/10= 8,2
Вибірка
Вибірка характеризується центральними тенденціями: середнім значенням, модою і медіаною.
Приклад
Середнім значенням вибірки називається середнє арифметичне всіх її значень.
Мода вибірки –значення вибірки, яке трапляється найчастіше.
Позначається Мо.
Медіа́на — це величина, що розташована в середині ряду величин, розташованих у зростаючому або спадному порядку
мода: 7
Вибірка
Вибірка характеризується центральними тенденціями: середнім значенням, модою і медіаною.
Приклад
Середнім значенням вибірки називається середнє арифметичне всіх її значень.
Мода вибірки –значення вибірки, яке трапляється найчастіше.
Позначається Мо.
Медіа́на — це величина, що розташована в середині ряду величин, розташованих у зростаючому або спадному порядку
Медіана: В порядку зростання 6,7,7,7,8,8,9,10,10,11
M=(8+8)/2= 8
Візуалізація рядів даних
Для змістового навантаження графіка чи діаграми важливо правильно вибрати їх тип:
гістограма
Лінійна діаграма
кругова діаграма
Статистичні характеристики рядів даних
Характеристика | Означення | Функція MS Excel |
Середнє арифметичне | Це частка від ділення суми цих чисел на їх кількість | AVERAGE (число1; число2;…) |
Обсяг вибірки | Кількість елементів у вибірці | Count |
Стандартне відхилення | Найпоширеніший показник розсіювання значень випадкової величини відносно середнього значення вибірки | STDEV.P |
мода | Число яке найчастіше зустрічається у ряді даних | MODE.SNGL |
медіана | Це величина, що розташована в середині ряду величин, розташованих у зростаючому або спадаючому порядку | MEDIAN |
Підготувала Олійник Н.М.
Завдання
1 та 2 в зошиті, 3 і 4 на комп'ютері
1). Нехай дано вибірку 2,3,4,5,6,4,6,6,8,7,9,8. Знайти моду Мо, середнє значення вибірки, медіану Ме.
2). Нехай дано вибірку 11,12,17,15,14,15,13,13,11,17,13. Знайти моду Мо, середнє значення вибірки та медіану Ме.
3). В програмі MS Excel або Таблиці google скласти таблицю з ваших оцінок за попередній клас. Обчисліть середнє арифметичне, моду, медіану для цього ряду даних.
4). Провести статистичне дослідження серед своїх друзів: «Скільки часу проводять з мобільним телефоном». Для отриманих даних створити таблицю в програмі MS Excel або Таблиці Google, знайти середнє арифметичне, моду, медіану для цього ряду даних та побудувати гістограму