1 of 32

Основи статистичного аналізу даних. Ряди даних

За навчальною програмою 2018 року

Урок 11

10

2 of 32

Основи статистичного�аналізу даних. Ряди даних

Розділ 2 § 11

Відповісти на подібні питання можна за допомогою статистичного аналізу даних.

Чи варто відкривати новий супермаркет в даному мікрорайоні?

Чи можна стверджувати, що на двох виробництвах підтримуються однакові технологічні умови?

Як скоригувати план лісозаготівлі?

10

© Вивчаємо інформатику teach-inf.at.ua

3 of 32

Поняття статистики

Розділ 2 § 11

Для аналізу кількісних характеристик використовують статистичні дослідження.

Статистика — наука про методи збирання, опрацювання, аналізу та інтерпретації даних, що характеризують масові явища і процеси, тобто явища і процеси, що стосуються не окремих об'єктів, а їх сукупностей.

10

© Вивчаємо інформатику teach-inf.at.ua

4 of 32

Поняття статистики

Розділ 2 § 11

Завданнями статистичного аналізу є:

  • опрацювання даних, отриманих в ході експерименту,
  • виявлення причинних зв'язків у перебігу явищ і процесів,
  • оцінка впливу досліджуваних факторів
  • формулювання належних висновків, на підставі яких можуть бути прийняті відповідальні рішення.

10

© Вивчаємо інформатику teach-inf.at.ua

5 of 32

Поняття статистики

Розділ 2 § 11

Статистичні дані — сукупність чисел, які дають кількісну характеристику ознак певних об'єктів та явищ, що нас цікавлять. Усю множину об'єктів, що є предметом статистичного дослідження, називають генеральною сукупністю вимірювань.

10

© Вивчаємо інформатику teach-inf.at.ua

6 of 32

Етапи статистичного дослідження

Розділ 2 § 11

Статистичне дослідження складається з трьох етапів.

  1. Збір і групування первинних статистичних даних, отриманих шляхом спостережень або вимірювань (результати соціологічного опитування, спостереження за природними явищами, проведення серії експериментів тощо).
  1. Аналіз отриманих статистичних даних (обчислення характеристик вибірок).
  1. Отримання висновків за даними спостережень (встановлення закономірностей, властивих генеральній сукупності).

10

© Вивчаємо інформатику teach-inf.at.ua

7 of 32

Етапи статистичного дослідження

Розділ 2 § 11

Генеральна сукупність складається з усіх об'єктів, які підлягають вивченню. Склад генеральної сукупності залежить від цілей дослідження.

Іноді генеральна сукупність — це все населення певного регіону (наприклад, коли вивчається ставлення потенційних виборців до кандидата).

Найчастіше задається кілька критеріїв, що визначають об'єкт дослідження. Наприклад, учні 10 класів, які навчаються за інформаційно-технологічним профілем.

10

© Вивчаємо інформатику teach-inf.at.ua

8 of 32

Етапи статистичного дослідження

Розділ 2 § 11

Вибірка, або вибіркова сукупність, — множина об'єктів, випадковим чином вибраних з генеральної сукупності для участі в дослідженні.

Генеральна сукупність у разі перевірки якості виробів  — це множина всіх виробів, що підлягають перевірці на відповідність стандартам. Для формування вибіркової сукупності можна випадковим чином відібрати для перевірки 5% від загальної кількості виробів.

10

© Вивчаємо інформатику teach-inf.at.ua

9 of 32

Етапи статистичного дослідження

Розділ 2 § 11

Аналітичному відділу фірми необхідно підготувати матеріали про реакцію клієнтів фірми щодо планованої зміни цінових знижок.

Опитати в короткі терміни всіх клієнтів нереально. Потрібно побудувати вибірку з генеральної сукупності всіх клієнтів фірми, внесених в базу даних, і опитати лише клієнтів з вибіркової сукупності.

Таким чином, на основі вивчення частини (реакції тих, хто потрапить у вибірку) можна отримати достовірну уяву про ціле (ймовірну реакцію всіх споживачів).

10

© Вивчаємо інформатику teach-inf.at.ua

10 of 32

Етапи статистичного дослідження

Розділ 2 § 11

Вибірка має бути репрезентативною, тобто її об'єкти повинні добре відображати властивості генеральної сукупності.

Репрезентативність вибірки — це здатність вибірки коректно відображати генеральну сукупність. Для того, щоб вибірка була репрезентативною, вона повинна генеруватися випадковим чином і мати достатньо великий обсяг.

10

© Вивчаємо інформатику teach-inf.at.ua

11 of 32

Ряди даних

Розділ 2 § 11

Вибірка містить набір значень певного параметра вибраних об'єктів, наприклад, набір оцінок учнів з математики. Переглядаючи неупорядковану множину чисел, важко виявити закономірність їх варіювання.

Для вивчення закономірностей варіювання значень величини над експериментальними даними виконують:

ранжування

групування

в порядку зростання або зменшення аналізованої кількісної ознаки

об'єднання в групи однакових значень

10

© Вивчаємо інформатику teach-inf.at.ua

12 of 32

Ряди даних

Розділ 2 § 11

Статистичний ряд розподілу — це впорядкований розподіл одиниць сукупності на групи за певною ознакою. Варіаційними рядами називають ряди розподілу, побудовані за кількісною ознакою.

Нехай у результаті проведення деякого експерименту було отримано вибірку

x1 x2, x3, ... хn

Значення х1 називають варіантами. Розташувавши варіанти х1 у порядку зростання, отримаємо варіаційний ряд.

10

© Вивчаємо інформатику teach-inf.at.ua

13 of 32

Ряди даних

Розділ 2 § 11

Частота — це число, яке показує, скільки разів зустрічається кожна варіанта.

Якщо ni — частоти варіант

 

Де n – об’єм вибірки (кількість значень у вибірковій сукупності).

10

© Вивчаємо інформатику teach-inf.at.ua

14 of 32

Ряди даних

Розділ 2 § 11

Ще одною характеристикою варіаційного ряду є відносна частота, яка визначається, як відношення частоти випадків даного значення до загальної суми частот.

Відносна частота визначається в частках одиниці або відсотках (%). Зрозуміло, що сума відносних частот повинна дорівнювати 1 (100 %).

10

© Вивчаємо інформатику teach-inf.at.ua

15 of 32

Ряди даних

Розділ 2 § 11

Варіаційні ряди бувають:

дискретні (перервні)

інтервальні (неперервні)

Дискретний варіаційний ряд — це такий ряд розподілу, в якому варіанта як величина кількісної ознаки може набувати тільки певних значень. Варіанти різняться між собою на одну чи кілька одиниць.

Так, кількість вироблених деталей за зміну конкретним робітником може виражатися тільки цілим числом (6, 7, 8 і т. д.).

10

© Вивчаємо інформатику teach-inf.at.ua

16 of 32

Ряди даних

Розділ 2 § 11

Упорядкуємо інформацію про кількість деталей, виготовлених за зміну кожним працівником цеху:

Ряд розподілу працівників за кількістю вироблених деталей:

10

© Вивчаємо інформатику teach-inf.at.ua

17 of 32

Ряди даних

Розділ 2 § 11

Об'єм вибірки n — це кількість варіант у вибірці, тобто кількість джерел інформації.

Для графічного відображення дискретного варіаційного ряду використовують полігон частот — ламану з вершинами у точках (zi, ni),

i = 1, 2, …, k

значення i-ї варіанти;

zi

відповідна цій варіанті частота.

ni

10

© Вивчаємо інформатику teach-inf.at.ua

18 of 32

Ряди даних

Розділ 2 § 11

Для побудови полігона частот на осі абсцис відкладають варіанти zi, а на осі ординат — відповідні частоти. Точки (zi, ni) сполучають відрізками прямих і отримують полігон частот.

10

© Вивчаємо інформатику teach-inf.at.ua

19 of 32

Ряди даних

Розділ 2 § 11

Зобразимо полігон частот варіаційного ряду, заданого таблицею.

Графічне зображення варіаційних рядів за допомогою полігона допомагає отримати наочне уявлення про закономірності спостережуваних значень.

10

© Вивчаємо інформатику teach-inf.at.ua

20 of 32

Ряди даних

Розділ 2 § 11

Для цього виділяємо таблицю і вибираємо команду Вставлення Діаграми Точкова Точкова з прямими лініями та маркерами.

1

2

3

10

© Вивчаємо інформатику teach-inf.at.ua

21 of 32

Ряди даних

Розділ 2 § 11

Частота розподілу працівників

за кількістю вироблених деталей

10

© Вивчаємо інформатику teach-inf.at.ua

22 of 32

Ряди даних

Розділ 2 § 11

При великому обсязі вибірки доречно побудувати інтервальний варіаційний ряд — такий ряд розподілу, в якому значення варіанти подано у вигляді інтервалів, тобто значення ознак, віднесених до однієї варіанти, можуть відрізнятися одне від одного на деяку малу величину.

Інтервали можуть бути:

рівні

нерівні

і

За частоту, що відповідає інтервалу, приймають суму частот, які потрапили в цей інтервал.

10

© Вивчаємо інформатику teach-inf.at.ua

23 of 32

Ряди даних

Розділ 2 § 11

Алгоритм побудови інтервального варіаційного ряду

1

Виходячи з обсягу вибірки (N), визначте кількість інтервалів (К). Зазвичай кількість інтервалів — у межах 5-20.

2

Визначте найбільше (Xmax) і найменше (Xmin) значення у вибірці.

3

Обчисліть розмах ряду: R = Xmax — Xmin

4

Визначте ширину інтервалу: Н = R / (К — 1).

5

Визначте межі кожного інтервалу в порядку зростання.

6

Підрахуйте кількість даних, що потрапили в кожний з інтервалів.

10

© Вивчаємо інформатику teach-inf.at.ua

24 of 32

Ряди даних

Розділ 2 § 11

Планується випускати шкільну форму. Потрібно з'ясувати, які розміри форми і в якій кількості слід закласти у план. Вимірювання зросту групи школярів дали такі результати (в см):

132, 132, 133, 134, 101, 134, 135, 105, 109, 138, 138, 110, 111, 140, 115, 125, 127, 115, 116, 127, 127, 116, 117, 127, 127, 117, 128, 117, 118, 130, 119, 131, 143, 124, 124, 144, 146, 124, 125, 150, 124, 158, 125, 121, 122, 121.

Розіб'ємо множину значень на 7 інтервалів:

[101, 109), [109, 117), [117, 125), [125, 133), [133, 141), [141, 149), [149, 158].

10

© Вивчаємо інформатику teach-inf.at.ua

25 of 32

Ряди даних

Розділ 2 § 11

Для кожного інтервалу визначимо частоту, тобто число значень, що потрапили до інтервалу. Обчислимо відносні частоти в інтервалах шляхом ділення частоти в інтервалі на суму всіх частот, яка в даному випадку дорівнює 46.

Відносна частота в інтервалі дає відсоток потрапляння до інтервалу даних від їхньої загальної кількості.

10

© Вивчаємо інформатику teach-inf.at.ua

26 of 32

Ряди даних

Розділ 2 § 11

Заповнимо таблицю частот інтервального варіаційного ряду:

Відносна частота кожної варіанти показує, яку частку кожного розміру слід закласти в план.

10

© Вивчаємо інформатику teach-inf.at.ua

27 of 32

Ряди даних

Розділ 2 § 11

Обчислення статистичних характеристик здійснюється за достатньо складними формулами.

В наступному параграфі ви дізнаєтесь, як обчислення характеристик вибірок реалізоване у відповідних функціях MS Excel.

10

© Вивчаємо інформатику teach-inf.at.ua

28 of 32

Розгадайте ребус

«Ребуси українською» © rebus1.com

Статистика

Розділ 2 § 11

10

© Вивчаємо інформатику teach-inf.at.ua

29 of 32

Питання для самоперевірки

Розділ 2 § 11

  1. Якою може бути вибіркова сукупність для опитування аудиторії телевізійного каналу серед мешканців міста, в якому проживає 100 тис. чоловік, 60 % з яких чоловіки і 40 % — жінки?
  1. Чи залежить репрезентативність вибірки від її розміру?
  1. Для яких вибірок будують дискретний варіаційний ряд?
  1. Поясніть відмінності між поняттями варіанта і частота.

10

© Вивчаємо інформатику teach-inf.at.ua

30 of 32

Домашнє завдання

Проаналізувати

§ 11, ст. 61-67

Розділ 2 § 11

10

© Вивчаємо інформатику teach-inf.at.ua

31 of 32

Працюємо за комп’ютером

Розділ 2 § 11

Сторінка

66-67

10

© Вивчаємо інформатику teach-inf.at.ua

32 of 32

Дякую за увагу!

За навчальною програмою 2018 року

Урок 11

10