1 of 31

Кодирование информации в компьютере

Текст, графика, звук

2 of 31

Двоичный код

Вся информация, которою обработает компьютер, должна быть представлена двоичным кодом с помощью двух цифр –

0 и 1.

Эти два символа 0 и 1 принято называть битами (от англ. binary digit – двоичный знак).

3 of 31

Кодирование и декодирование

Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код.

Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.

4 of 31

Способы кодирования

Способы кодирования и декодирования информации в компьютере, в первую очередь, зависит от вида информации, а именно, что должно кодироваться:

числа, текст,

графические изображения или звук.

5 of 31

Представление чисел

Для записи информации о количестве объектов используются числа. Числа записываются с использование особых знаковых систем, которые называют системами счисления.

Система счисления – совокупность приемов и правил записи чисел с помощью определенного набора символов.

6 of 31

Позиционные и непозиционные системы счисления

Все системы счисления делятся на две большие группы:

ПОЗИЦИОННЫЕ

НЕПОЗИЦИОННЫЕ

Количественное значение каждой цифры числа зависит от того, в каком месте (позиции или разряде) записана та или иная цифра.

0,7 7 70

Количественное значение цифры числа не зависит от того, в каком месте (позиции или разряде) записана та или иная цифра.

XIX

7 of 31

Римская непозиционная система счисления

Самой распространенной из непозиционных систем счисления является римская. В качестве цифр используются:

I(1), V(5), X(10), L(50), C(100), D(500), M(1000).

Величина числа определяется как сумма или разность цифр в числе.�

MCMXCVIII = 1000+(1000-100)+(100-10)+5+1+1+1 = 1998

8 of 31

Позиционные системы счисления

Первая позиционная система счисления была придумана еще в Древнем Вавилоне, причем вавилонская нумерация была шестидесятеричная, т.е. в ней использовалось шестьдесят цифр!

В XIX веке довольно широкое распространение получила двенадцатеричная система счисления.

В настоящее время наиболее распространены десятичная, двоичная, восьмеричная и шестнадцатеричная системы счисления.

9 of 31

Основание системы счисления

Количество различных символов, используемых для изображения числа в позиционных системах счисления, называется основанием системы счисления.

Система счисления

Основание

Алфавит цифр

Десятичная

10

0, 1, 2, 3, 4, 5, 6, 7, 8, 9

Двоичная

2

0, 1

Восьмеричная

8

0, 1, 2, 3, 4, 5, 6, 7

Шестнадцатеричная

16

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F

10 of 31

Соответствие систем счисления

Десятичная

8

9

10

11

12

13

14

15

16

Двоичная

1000

1001

1010

1011

1100

1101

1110

1111

10000

Восьмеричная

10

11

12

13

14

15

16

17

20

Шестнадцатеричная

8

9

A

B

C

D

E

F

10

Десятичная

0

1

2

3

4

5

6

7

Двоичная

0

1

10

11

100

101

110

111

Восьмеричная

0

1

2

3

4

5

6

7

Шестнадцатеричная

0

1

2

3

4

5

6

7

11 of 31

Двоичное кодирование текстовой информации

Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации.

Традиционно для кодирования одного символа используется количество информации = 1 байту (1 байт = 8 битов).

12 of 31

Двоичное кодирование текстовой информации

Для кодирования одного символа требуется один байт информации.

Учитывая, что каждый бит принимает значение 1 или 0, получаем, что с помощью 1 байта можно закодировать 256 различных символов.

28=256

13 of 31

Двоичное кодирование текстовой информации

Кодирование заключается в том, что каждому символу ставиться в соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255).

Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется кодовой таблицей.

14 of 31

Таблица кодировки

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется таблицей кодировки.

Для разных типов ЭВМ используются различные кодировки. С распространением IBM PC международным стандартом стала таблица кодировки ASCII (American Standart Code for Information Interchange) – Американский стандартный код для информационного обмена.

15 of 31

Таблица кодировки ASCII

Стандартной в этой таблице является только первая половина, т.е. символы с номерами от 0 (00000000) до 127 (0111111). Сюда входят буква латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.

Остальные 128 кодов используются в разных вариантах. В русских кодировках размещаются символы русского алфавита.

В настоящее время существует 5 разных кодовых таблиц для русских букв (КОИ8, СР1251, СР866, Mac, ISO).

В настоящее время получил широкое распространение новый международный стандарт Unicode, который отводит на каждый символ два байта. С его помощью можно закодировать 65536 (216= 65536 ) различных символов.

16 of 31

Таблица стандартной части ASCII

17 of 31

Таблица расширенного кода ASCII

18 of 31

Обратите внимание!

Цифры кодируются по стандарту ASCII в двух случаях – при вводе-выводе и когда они встречаются в тексте. Если цифры участвуют в вычислениях, то осуществляется их преобразование в другой двоичных код.

Возьмем число 57.

При использовании в тексте каждая цифра будет представлена своим кодом в соответствии с таблицей ASCII. В двоичной системе это – 00110101 00110111.

При использовании в вычислениях код этого числа будет получен по правилам перевода в двоичную систему и получим – 00111001.

!

19 of 31

Кодирование графической информации

Создавать и хранить графические объекты в компьютере можно двумя способами – как растровое или как векторное изображение. Для каждого типа изображений используется свой способ кодирования.

ИЗОБРАЖЕНИЯ

РАСТРОВЫЕ

ВЕКТОРНЫЕ

20 of 31

Кодирование растровых изображений

Растровое изображение представляет собой совокупность точек (пикселей) разных цветов.

Для черно-белого изображения информационный объем одной точки равен одному биту (либо черная, либо белая – либо 1, либо 0).

Для четырех цветного – 2 бита.

Для 8 цветов необходимо – 3 бита.

Для 16 цветов – 4 бита.

Для 256 цветов – 8 бит (1 байт).

Цветное изображение на экране монитора формируется за счет смешивания трех базовых цветов: красного, зеленого, синего. Т.н. модель RGB.

Для получения богатой палитры базовым цветам могут быть заданы различные интенсивности.

4 294 967 296 цветов (True Color) – 32 бита (4 байта).

21 of 31

Кодирование векторных изображений

Векторное изображение представляет собой совокупность графических примитивов (точка, отрезок, эллипс…). Каждый примитив описывается математическими формулами. Кодирование зависти от прикладной среды.

эллипс

прямоугольник

кривая

22 of 31

Двоичное кодирование звука

Звук – волна с непрерывно изменяющейся амплитудой и частотой. Чем больше амплитуда, тем он громче для человека, чем больше частота, тем выше тон.

В процессе кодирования звукового сигнала производится его временная дискретизация – непрерывная волна разбивается на отдельные маленькие временные участки.

Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации.

23 of 31

Примеры решения задач на кодирование

Текст: В одном из изданий книги Л.H. Толстого "Война и Мир" 1024 страницы. Какой объём памяти (в Мбайтах) заняла бы эта книга, если бы Лев Николаевич набирал её на компьютере в кодировке KOI-8? На одной странице помещается 64 строки, а в строке помещается 64 символа. Каждый символ в кодировке KOI-8 занимает 8 бит памяти.

Графика: . Укажите минимальный объем памяти (в килобайтах), достаточный для хранения любого растрового изображения размером 64×64 пикселя, если известно, что в изображении используется палитра из 256 цветов. Саму палитру хранить не нужно.

Звук: Производится одноканальная (моно) звукозапись с частотой дискретизации 16 кГц и 24-битным разрешением. Запись длится 1 минуту, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

1) 0.2 2) 2 3) 3 4) 4

24 of 31

Текст

В одном из изданий книги Л.H. Толстого "Война и Мир" 1024 страницы. Какой объём памяти (в Мбайтах) заняла бы эта книга, если бы Лев Николаевич набирал её на компьютере в кодировке KOI-8? На одной странице помещается 64 строки, а в строке помещается 64 символа. Каждый символ в кодировке KOI-8 занимает 8 бит памяти.

Решение:

1024 ⋅ 64 ⋅ 64 ⋅ 8 /8/1024/1024=4 Мб

Формула:

I=K ⋅ b

I –размер текста в битах

K – количество символов

b – вес одного символа в битах (обычно 8 или 16 бит)

2b = N - количество символов в алфавите

25 of 31

Графика

Укажите минимальный объем памяти (в килобайтах), достаточный для хранения любого растрового изображения размером 64×64 пикселя, если известно, что в изображении используется палитра из 256 цветов. Саму палитру хранить не нужно.

Решение: 2b=256 b=8 бит

I=64 ⋅ 64⋅8/8/1024= 4 Кб

Формула:

I=M ⋅ K ⋅ b

I –размер рисунка в битах

MxK – растр в пикселях

2b=N

N – цветовая палитра

b – вес одного пикселя в битах

26 of 31

Изображение размером 12 Мбайт сжимают для экономии памяти. Известно, что разрешение уменьшили вдвое, а цветовую палитру с 2^15 = 32768 цветов сократили до 1024 цветов. Сколько Мбайт займет сжатый файл?

12x10/15/4=?Мб

27 of 31

Для хранения в информационной системе документы сканируются с разрешением 150 dpi и цветовой системой, содержащей 256 цветов. Методы сжатия изображений не используются. Средний размер отсканированного документа составляет 3 Мбайт. Для повышения качества представления информации было решено перейти на разрешение 300 dpi и цветовую систему, содержащую 2^24 = 16777216 цветов. Сколько Мбайт будет составлять средний размер документа, отсканированного с изменёнными параметрами?

было 2^b = 256 b=8 бит

стало 24 бита

3х(300х300)/(150х150)х24/8= ? Мб

28 of 31

В информационной системе хранятся изображения размером 2048×1600 пикселей. При кодировании используется алгоритм сжатия изображений, позволяющий уменьшить размер памяти для хранения одного изображения в среднем в 8 раз по сравнению с независимым кодированием каждого пикселя. Каждое изображение дополняется служебной информацией, которая занимает 64 Кбайт. Для хранения 32 изображений выделено 12 Мбайт памяти. Какое максимальное количество цветов можно использовать в палитре каждого изображения?

((12х1024/32)-64)х8/(2048х1600)=b

2^b=?

29 of 31

Звук

Производится одноканальная (моно) звукозапись с частотой дискретизации 16 кГц и 24-битным разрешением. Запись длится 1 минуту, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

1) 0.2 2) 2 3) 3 4) 4

Решение:

I=1⋅16000⋅24⋅60/8/1024/1024= 2 Мб

I=n⋅H⋅b⋅t

I – размер файла в битах

n – число дорожек

H - частота дискретизации Гц (1/сек)

b – глубина кодирования

t – время в секундах

30 of 31

Вычисление количества информации

Световое табло состоит из лампочек. Каждая лампочка может находиться в одном из трех состояний («включено», «выключено» или «мигает»). Какое наименьшее количество лампочек должно находиться на табло, чтобы с его помощью можно было передать 18 различных сигналов?

Решение:

т.к. состояний 3, то можно записать формулу – 3b>=18 (b – минимальное)

b – это и есть количество лампочек

b = 3

31 of 31

Вычисление количества информации

В велокроссе участвуют 119 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер с использованием минимально возможного количества бит, одинакового для каждого спортсмена. Каков информационный объем сообщения в битах, записанного устройством, после того как промежуточный финиш прошли 70 велосипедистов?

Решение:

Т.к. кодирование двоичное, то можно записать формулу

2b >=119

Следовательно минимальное b=7 бит

7⋅70= 490 бит