Двійкове кодування. Одиниці вимірювання довжини двійкового коду. Кодування тексту
Нова українська школа
Урок 2
Інформатика 8
teach-inf.com.ua
за підручником
Бондаренко О.О. та ін.
Двійкове кодування
Комп’ютер – універсальний пристрій для опрацювання даних різних типів. Розгляньмо, як у ньому кодуються дані.
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Принцип двійкового кодування
Звичні вам числа називають десятковими, тому що для їх запису використовують 10 цифр:
Дані ж у комп’ютері подаються електричними, світловими або магнітними сигналами, що набувають тільки двох станів:
вимкнено
(немає струму, розмагнічено)
0
увімкнено
(є струм, намагнічено)
1
0, 1, 2, 3, 4, 5, 6, 7, 8, 9.
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Принцип двійкового кодування
Тому будь-які дані для опрацювання комп’ютером:
числові
текстові
звукові
графічні
Кодують за допомогою лише двох знаків — нуля (0) й одиниці (1). Такий спосіб кодування називають двійковим. Двійкове кодування легко реалізувати в електронних пристроях.
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Кодування символів
За допомогою однознакового двійкового коду можна закодувати лише два різні символи. Тому для кодування символів у комп’ютері застосовують багатознакові двійкові коди, в яких код кожного символу складається з кількох записаних у рядок нулів або одиниць.
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Кодування символів
У таких кодах цифру 0 або 1 називають бітом (скор. від англ. binary digit — двійкова цифра).
За кількістю бітів n, відведених для кодування одного символу, легко визначити число символів N, які можна закодувати:
N = 2n
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Кодування символів
Для кодування (декодування) тексту всі символи зводять у кодову таблицю, де поряд із двійковим кодом, а іноді й замість нього, записують десятковий код.
8-бітовий код придатний для кодування до
N = 28 = 256 різних символів,
а 16-бітовий – до N = 216 = 65 536 символів.
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
7-бітовий код ASCII
ASCII (American Standard Code for Information Interchange — американський стандартний код для обміну інформацією) є однією з найдавніших і найпоширеніших таблиць двійкових кодів символів. Її першу редакцію опубліковано 1963 року.
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
7-бітовий код ASCII
У таблиці ASCII десяткові:
є керувальними кодами
числа від 0 до 31
кодують символи: великі й малі літери латинського алфавіту, розділові знаки, знаки математичних операцій тощо
числа від 32 до 127
відповідає символу пропуск
код 32
знаку оклику і т. д.
код 33
Англійські літери в таблиці ASCII розташовані в алфавітному порядку.
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
7-бітовий код ASCII
Щоб побачити на екрані символи сучасної версії таблиці ASCII, слід запустити таку програму мовою Python:
for i in range(33, 127):
print(chr(i), end = '')
Буде виведено:
!"#$%&'()*+,./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
8-бітовий код KOI8-U
Для кодування літер інших алфавітів (зокрема кириличних) таблицю ASCII доповнюють до 256 символів. Для цього 7-бітові коди ASCII доповнюють зліва 0, а коди для нових символів утворюють додаванням зліва 1.
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
8-бітовий код KOI8-U
Зокрема, для літер українського алфавіту використовують таблицю кодів K0I8-U (Код Обміну Інформацією 8-бітовий Український).
Розглянемо фрагмент таблиці кодів KOI8-U:
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Стандарт Юнікод
Із розвитком і поширенням комп’ютерів виникла потреба в кодуванні значно більшої кількості символів, ніж дозволяють 8-бітові коди.
Так, у сучасних текстових документах здебільшого використовується сімейство кодів, описаних у стандарті Юнікод (від англ. Unicode — уніфіковане кодування), що з’явився 1991 року. Поширений нині варіант Юнікоду — код UTF-8 — дає змогу закодувати до 1112064 різних символів.
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Одиниці довжини двійкового коду
Двійкове кодування застосовують не лише для текстових, а й для графічних, звукових та інших даних.
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Одиниці довжини двійкового коду
У всіх випадках обсяг даних вимірюють довжиною двійкового коду.
Послідовність із 8 двійкових розрядів (бітів) називають байтом. Наприклад, 10101101.
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Одиниці довжини двійкового коду
За 8-бітового кодування тексту кожен символ кодується одним байтом. Розділові знаки та пропуски також є символами, що мають свої коди.
Текст:
Марійка грає в шахи.
Складається з 20 символів із урахуванням пробілів і розділових знаків. Тому за 8-бітового кодування цей текст має обсяг 20 байтів.
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Одиниці довжини двійкового коду
Зверніть увагу, що на практиці зручніше користуватися більшими одиницями вимірювання:
1 КіБ = 210 Б = 1024 Б ≈ 103 Б
1 МіБ = 210 КіБ = 1024 КіБ ≈ 106 Б
1 ГіБ = 210 МіБ = 1024 МіБ ≈ 109 Б
1 ТіБ = 210 ГіБ = 1024 ГіБ ≈ 1012 Б
кібібайт (КіБ)
мебібайт (МіБ)
гібібайт (ГіБ)
тебібайт (ТіБ)
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Одиниці довжини двійкового коду
Наведені в таблиці значення степенів двійки наближено дорівнюють множникам Міжнародної системи одиниць, які відповідають префіксам кіло-, мега-, гіга- тощо.
Тому у повсякденному спілкуванні часто помилково використовують назви «кілобайт», «мегабайт», «гігабайт» тощо, навіть коли йдеться про їхні двійкові відповідники.
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Одиниці довжини двійкового коду
Нехай сторінка книжки містить 56 рядків по 64 символи в кожному рядку. Обчислимо обсяг даних (довжину двійкового коду) на сторінці за 8-бітового кодування.
Маємо:
56 · 64 = 3584 байти =
3,5 КіБ
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Одиниці довжини двійкового коду
Щоб обчислити приблизний обсяг текстових даних у книжці, потрібно обсяг даних на сторінці помножити на кількість сторінок.
Розрахуємо обсяг даних у книжці з 256 подібних сторінок:
3584 · 256 = 917 504 Б =
896 КіБ = 0,875 МіБ
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Одиниці довжини двійкового коду
Двійковий код літери Р має довжину 1 байт. Сама ця літера, намальована на дорожньому знаку, несе інформацію для водія:
поряд зі знаком є облаштоване місце для стоянки.
Не слід ототожнювати довжину двійкового коду текстового повідомлення з обсягом інформації, яку воно містить.
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Питання для самоперевірки
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Розгадайте ребус
Символ
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Домашнє завдання
Проаналізувати
с. 11-15
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Працюємо за комп’ютером
Сторінка
15
Розділ 1
§ 2
© Вивчаємо інформатику teach-inf.com.ua
Успіхів�у навчанні!
Нова українська школа
Урок 2
Інформатика 8
teach-inf.com.ua
за підручником
Бондаренко О.О. та ін.