Двоичное кодирование информации в компьютере

 

Вся информация, которую обрабатывает компьютер должна быть представлена двоичным кодом с помощью двух цифр: 0 и 1. Эти два символа принято называть двоичными цифрами или битами. 

Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код.

Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.

Способы кодирования и декодирования информации в компьютере, в первую очередь, зависит от вида информации, а именно, что должно кодироваться: числа, текст, графические изображения или звук.

 

 

Двоичное кодирование текстовой информации

 

Для представления текстовой информации (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы) достаточно 256 различных знаков.

По формуле

N = 2I

     можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак:

N = 2I          

256 =  2I         

28 = 2I      

 I = 8 битов

 

Для обработки текстовой информации на компьютере необходимо представить ее в двоичной знаковой системе.

Каждому знаку необходимо поставить в соответствие уникальный 8-битовый двоичный код, значения которого находятся в интервале от 00000000 до 11111111 (в десятичном коде от 0 до 255).

Присвоение знаку конкретного двоичного кода — это вопрос соглашения, которое фиксируется в кодовой таблице.

К сожалению, в настоящее время существуют пять различных кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.

 

В последние годы широкое распространение получил новый международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов).

По формуле N = 2можно определить количество символов, которые можно закодировать:

N = 2I = 216 = 65 536

Такого количества символов оказалось достаточно, чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты.

 

Windows, MS-DOS, КОИ-8, Mac, ISO – 8-битовый двоичный код – 256 символов

Unicode – 16-битовый двоичный код – 65 536 символов

 

 

Задача 1

Скорость передачи данных через модемное соединение равна 32 Кбит/с. Передача текстового файла через это соединение заняла 15 с. Определите, сколько страниц содержал переданный текст, если известно, что он был представлен в кодировке Unicode, а на одной странице – 48 символов.

1) 10 2) 640 3) 1280 4) 10240

 

Решение:

Объем текстового файла:

32 Кбит/c  * 15 с = 480 Кбит

Объем одной страницы (Unicode – 1 символ – 16 бит):

48 символов * 16 бит = 768 бит

Количество страниц:

480 Кбит = 480 *1024 = 491 520 бит

491 520 бит / 768 бит = 640 (страниц)

Ответ: 640

 

 

Задача 2

Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode,

в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 480 бит.

Какова длина сообщения в символах?

1) 30 2) 60 3) 120 4) 480

Решение:

х – длина сообщения в символах

16 * х бит – объем сообщения в 16-битном коде Unicode

8 * х бит – объем сообщения в 8-битной кодировке КОИ-8

16х – 8х = 480

8х = 480

х = 60

 

Ответ: 60

 

Двоичное кодирование графической информации

 

Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме. При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно. При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно..

Графические изображения из аналоговой (непрерывной) формы в цифровую (дискретную) преобразуются путем пространственной дискретизации.

Изображение разбивается на отдельные маленькие фрагменты (точки, или пиксели), причем каждый элемент может иметь свой цвет (красный, зеленый, синий и т. д.).

 

Пиксель — минимальный участок изображения, которому независимым образом можно задать цвет.

В результате пространственной дискретизации графическая информация представляется в виде растрового изображения, которое формируется из определенного количества строк, которые, в свою очередь, содержат определенное количество точек.

Важнейшей характеристикой качества растрового изображения является разрешающая способность.

Разрешающая способность растрового изображения определяется количеством точек по горизонтали и вертикали на единицу длины изображения.

При одних и тех же размерах экрана чем меньше размер точки, тем больше разрешающая способность (больше количество строк растра и точек в строке), и, соответственно, выше качество изображения.

Величина разрешающей способности обычно выражается в dpi (dot per inch — точек на дюйм), т. е. в количестве точек в полоске изображения длиной один дюйм (1 дюйм = 2,54 см).

 

В процессе дискретизации могут использоваться различные палитры цветов, т. е. наборы цветов, которые могут принимать точки изображения.

Каждый цвет можно рассматривать как возможное состояние точки.

Количество цветов N в палитре и количество информации I, необходимое для кодирования цвета каждой точки, связаны между собой и могут быть вычислены по формуле

N = 2I

     Количество информации, которое используется при кодировании цвета точек изображения, называется глубиной цвета.

 

Наиболее распространенными значениями глубины цвета при кодировании цветных изображений являются 4, 8, 16 или 24 бита на точку.

Можно определить количество цветов для каждой палитры:

N = 24 = 16

N = 28 = 256

N = 216 = 65 536

N = 224 = 16 777 216

 

 

 

Задача 1

Черно-белое (без градаций серого цвета) растровое графическое изображение имеет размер 10х10 точек.

Какой объем памяти займет это изображение?

1) 100 битов 2) 100 байтов

3) 1 000 битов 4) 1 000 байтов

Решение:

Общее количество пикселей изображения 10 * 10 = 100.

Так как используется всего два цвета, то для хранения каждого пикселя необходим один бит.

Таким образом, изображение займет объем памяти 100 битов.

 

 

Задача 2

Цветное (с палитрой из 256 цветов) растровое графическое изображение имеет размер 10х10 точек. Какой объем памяти займет это изображение?

1) 100 битов 2) 800 битов 3) 100 байтов 4) 800 байтов

Решение:

Общее количество пикселей изображения 10х10 =100. Используется палитра из 256 цветов (N). Каждый цвет можно рассматривать как возможное состояние точки.

Количество цветов N в палитре и количество информации I, необходимое для кодирования цвета каждой точки связаны формулой

N = 2I

256 = 28,   

2I = 28,    

 I = 8

Для хранения каждого пикселя необходимо 100 * 8 = 800 битов

 

Двоичное кодирование звука

 

Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну с непрерывно меняющейся интенсивностью и частотой.

Человек воспринимает звуковые волны (колебания воздуха) с помощью слуха в форме звуков различной громкости и тона, чем больше интенсивность звуковой волны, тем громче, звук, чем больше частота волны, тем выше тон звука.

Для того чтобы компьютер мог обрабатывать реальный (записанный) звук, непрерывный звуковой сигнал (аналоговый) должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации.

Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина интенсивности звука.

 

Для записи аналогового звука и его преобразования в цифровую форму используется микрофон, подключенный к звуковой плате.

Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации.

Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее «лесенка» цифрового звукового сигнала повторяет кривую аналогового сигнала.

    Частота дискретизации звука — это количество измерений громкости звука за одну секунду.

Частота дискретизации звука может лежать в диапазоне от 8000 до 50 000 измерений громкости звука за одну секунду.

 

Каждому уровню дискретизации присваивается определенное значение уровня громкости звука.

Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.

     Глубина кодирования звука — это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле

N = 2I.

N –  количество уровней громкости цифрового звука 

I  –  глубина кодирования звука

 

 

Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно

N = 2I = 216 = 65 536.

Чем больше частота дискретизации и глубина кодирования звука, тем более качественным будет звучание оцифрованного звука.

Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, будет при частоте дискретизации 8000 раз в секунду, глубине кодирования 8 битов и записи одной звуковой дорожки (режим моно).

 

Высокое качество оцифрованного звука, соответствующее качеству аудио-CD, обеспечивается при частоте дискретизации 48 000 раз в секунду, глубине кодирования

16 битов и записи двух звуковых дорожек (режим стерео).

 

 

Задача 1

Аналоговый звуковой сигнал был дискретизирован сначала с использованием 65 536 уровней интенсивности сигнала (качество звучания аудио-CD), а затем – с использованием 256 уровней интенсивности сигнала (качество звучания радиотрансляции).

    Во сколько раз различаются информационные объемы оцифрованных звуковых сигналов?

1) в 256 раз 2) в 16 раз 3) в 8 раз 4) в 2 раза

 

Решение:

N = 2I,  65 536 = 2I,  216 = 2I,  I=16

N = 2I,  256 = 2I,  28 = 2I,  I=8

Информационные объемы оцифрованных звуковых сигналов различаются в 2 раза.

 

Задача 2

 

Рассчитайте время звучания моноаудиофайла, если при 16-битном кодировании и частоте дискретизации 32 кГц его объем равен 700 Кбайт.

1) 11,2 сек 2) 14 сек 3) 7 сек 4) 35 сек

Решение:

Объем звучания 1 сек: (глубина кодирования * частоту дискретизации)

1 Гц = 1/с, 1 кГц = 103 Гц

16 бит х 32 000 1/с = 512 000 бит/c

Перевод в байты: (1 байт = 8 бит, 1 Кбайт = 1024 байта)

512 000 бит : 8 = 64 000 байт

64 000 байт : 1024 = 62,5 Кбайт

Время звучания: (объем файла / объем звучания 1 сек)

700 Кбайт :62,5 Кбайт = 11,2 сек

 

 

Представление видеоинформации

Что представляет собой фильм с точки зрения информатики? Прежде всего, это сочетание звуковой и графической информации. Кроме того, для создания на экране эффекта движения используется дискретная по своей сути технология быстрой смены статических картинок. Исследования показали, что если за одну секунду сменяется более 10-12 кадров, то человеческий глаз воспринимает изменения на них как непрерывные.

 

Мультимедиа (multimedia, от англ. multi - много и media - носитель, среда) - совокупность компьютерных технологий, одновременно использующих несколько информационных сред: текст, графику, видео, фотографию, анимацию, звуковые эффекты, высококачественное звуковое сопровождение.