Для обработки текстовой информации компьютер использует двоичную систему счисления, состоящую из двух цифр: 0 и 1.
В компьютере используется байтовый принцип организации памяти: каждая клеточка – бит памяти.
Бит – это наименьшая единица измерения количества информации, принимающая значение 1 или 0.
Восемь подряд расположенных битов образуют байт.
Порядковый номер байта является его адресом. По этим адресам процессор обращается к данным, читая и записывая их в память.
В популярных системах кодировки (ASCII и др.) каждый символ заменяется на 8-разрядное целое положительное двоичное число, т.е. 1 символ компьютерного алфавита «весит» 8 битов.
Согласно формуле информатики 2i=N можно закодировать: 28 = 256 символов.
Присвоение символу конкретного кода определено таблицей кодировки ASCII. Таблица кодов ASCII делится на две части. Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111). Сюда входят буква латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.
Остальные 128 кодов используются в разных вариантах. В русских кодировках размещаются символы русского алфавита.
В настоящее время получил широкое распространение новый международный стандарт Unicode, который отводит на каждый символ 2 байта. С его помощью можно закодировать (216= 65536) различных символов.
Пример представления текста в памяти компьютера:
Кодирование текстовой информации
Кодирование – преобразование входной информации в машинную форму (в двоичный код).
Декодирование – преобразование двоичного кода в форму, понятную человеку.
Число символов алфавита (мощность алфавита) : N= 2i | Информационный объем текста: I = i*К |
где i - информационный вес одного символа; | i – информационный вес одного символа (количество бит на кодирование одного символа); |
Объём данных при передаче: I = V * t, |
Название | Соотношение с другими единицами |
Бит | Двоичная цифра (0 или 1) |
Байт | 8 бит |
Килобайт | 1 Кб = 210 байт=1024 байт |
Мегабайт | 1 Мб = 210 Кб = 220 байт |
Гигабайт | 1 Гб = 210 Мб = 220 Кб = 230 байт |
Терабайт | 1 Тб = 210 Гб = 220 Мб = 230 Кб = 240 байт |
Справочная таблица единиц измерения объема информации:
Задача 1.
В одном из вариантов кодировки Unicode каждый символ кодируется двумя байтами. Определите количество символов в сообщении, если информационный объём сообщения в этой кодировке равен 480 бит.
1) 60 2) 40 3) 240 4) 30
Решение.
1). Количество символов: К = I / i = 480 / 16 = 30
Ответ: 4) 30
Задача 2.
Информационное сообщение объёмом 5 Кбайт содержит 8192 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение?
Решение:
1). I = i * k
Объем сообщения: I =5 Кб =5120 байт =40960 бит
2). Сообщение содержит 8192 символа, следовательно:
i = I / k i = 40960:8192 = 5 бит (вес одного символа).
3). N = 25 = 32
Ответ: 32
Аналоговый и дискретный способы представления изображений и звука
Графическая и звуковая информация может быть представлена в аналоговой или дискретной форме.
При аналоговом представлении физическая величина принимает бесконечное множество значений, которые изменяются непрерывно.
При дискретном представлении физическая величина принимает конечное множество значений.
Дискретизация – это преобразование непрерывных изображений и звука в набор дискретных значений в форме двоичных кодов.
12
Графическая информация
Вся графическая информация в компьютере представлена в виде растровой и векторной графики.
В растровой графике точечный рисунок состоит из пикселей.
Графические редакторы растрового типа в основном ориентированы не для создания изображений, а на их обработку.
Достоинство растровой графики – эффективное представление изображений фотографического качества.
Недостаток – большой объем памяти, искажение изображения при его масштабировании.
Растровые графические файлы имеют форматы
JPEG, BMP, TIFF и др.
Графическая информация
В векторной графике графическая информация – это графические примитивы, составляющие рисунок: прямые, дуги, прямоугольники и пр.
Рисунок представляются в системе экранных координат. Достоинство векторной графики – небольшой объем памяти и масштабирование изображений без потери качества.
Векторные графические редакторы предназначены для создания оформительских, чертежных и проектно-конструкторских работ.
Векторные графические файлы имеют форматы WMF, CGM.
Все графические данные, помещаемые в видеопамять и выводимые на экран, имеют растровый формат.
16
Растровое кодирование (True Color)
Шаг 3. От цвета – к числам: модель RGB
цвет = R + G + B
red
красный
0..255
blue
синий
0..255
green
зеленый
0..255
R = 218G = 164B = 32
R = 135G = 206B = 250
Шаг 4. Числа – в двоичную систему.
256·256·256 =2563 = 16 777 216 цветов
R: 256 = 28 вариантов, нужно 8 бит = 1 байтR G B: 2563 = 224 вариантов, нужно 24 бита = 3 байта
Каждый цвет ( красный, зеленый и синий) имеет 256 уровней интенсивности. Поэтому можно закодировать:
Количество памяти для хранения цвета 1 (точки) пикселя?
17
В современных компьютерах используются 3 разрешающие способности экрана: 800х600, 1024х768 и 1280х1024 точки.
Для черно-белого изображения, без градаций серого цвета, каждая точка экрана может иметь одно из двух состояний – «черная» или «белая», то есть для хранения ее состояния необходим 1 бит.
Цветные изображения формируются в соответствии с двоичным кодом цвета каждой точки (глубиной цвета), хранящимся в видеопамяти.
Двоичное кодирование графической информации
Двоичное кодирование графической информации
Глубина цвета (i) – это количество битов, которое используется для кодирования цвета одной точки.
Глубина цвета одной точки | Количество отображаемых цветов |
3 бита | 23 = 8 цветов |
4 бита | 24 = 16 цветов |
8 битов | 28 = 256 цветов |
16 битов | 216 = 65536 цветов |
24 бита | 224 = 16777216 цветов |
32 бита | 232 = 4294967296 цветов |
Задача 1. Рассчитать необходимый объем видеопамяти для графического режима с разрешением 800х600 точек и глубиной цвета 24 бита на одну точку.
Решение:
1). Всего точек на экране: К=800∙600=480000.
2). Необходимый объем памяти: I = 24 бит∙480000 =
11520000бит = 1440000 байт = 1406,25 Кб = 1,37 Мб.
Ответ: 1,37 Мб.
Задача 2:
Сколько секунд потребуется для передачи сообщения со скоростью V=14400 бит/сек, чтобы передать цветное изображение размером
800 х 600 пикселей, при условии, что в палитре N=65536 цветов?
Решение:
1). При N = 65536, i = 2 байта = 16 битов.
2). Общее количество пикселей в изображении: К= 800 х 600 =480000.
3). Вычислим объем памяти для 480000 пикселей:
I = K * i = 480 000*2= 960 000 байт * 8 = 7 680 000 бит.
4) Найдем время передачи сообщения: t = I / V =
7 680 000 / 14 400 533 секунд.
Ответ: 533 секунды.
Двоичное кодирование звуковой информации
Звук представляет собой непрерывный сигнал — звуковую волну с меняющейся амплитудой и частотой.
Чем больше амплитуда сигнала, тем он громче для человека.
Чем больше частота сигнала, тем выше тон.
Частота звуковой волны выражается числом колебаний в секунду и измеряется в герцах (Гц).
Двоичное кодирование звуковой информации
Ввод звука в компьютер производится с помощью звукового устройства (микрофон и др.), выход которого подключается к порту звуковой карты.
Звуковая карта производит измерения уровня звукового сигнала (преобразованного в электрические колебания) и результаты записывает в память компьютера в виде последовательности электрических импульсов (двоичных нулей и единиц). Этот процесс называется оцифровкой звука.
Промежуток времени между двумя измерениями называется периодом измерений (сек).
Обратная величина К=1/ (герц) называется частотой дискретизации.
Двоичное кодирование звуковой информации
Частота дискретизации (К) — это количество измерений уровней сигнала за 1секунду.
Количество бит, отводимое на один звуковой сигнал, называют глубиной кодирования звука (i).
Современные звуковые карты обеспечивают 16-, 32- или 64-битную глубину кодирования звука.
Качество двоичного кодирования звука определяется глубиной кодирования звука (i) и частотой дискретизации (К).
Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Чем выше качество цифрового звука, тем больше информационный объем звукового файла.
Глубина кодирования звука (i) | Частота дискретизации (К) |
16 бит | от 8 до 48 кГц. |
32 бита | |
64 бита |
Количество уровней звука: N = 2i | Информационный объём аудиофайла I = t∙К∙i t = I / (K∙i) |
где | где t - время звучания (секунд), |
Двоичное кодирование звуковой информации
Решение: Для этого количество выборок в 1 секунду умножить на количество битов, приходящихся на одну выборку и умножить на 2 (стерео):
I = t∙К∙i = 48000∙16∙2 бит = 1536000 бит/ 8 =
192000 байт = 187,5 Кбайт.
Ответ:187,5 Кбайт.
Задача 1: Оценить информационный объем стерео-аудиофайла длительностью звучания 1 секунда при высоком качестве звука
( i =16 битов, K = 48кГц = 48000 Гц).
Задача 2:
Производится двухканальная (стерео) звукозапись с частотой дискретизации K=48 кГц и i=32-битным разрешением, результаты записываются в файл, сжатие данных не используется. Размер файла с записью не может превышать I=16 Мбайт.
Какая из приведённых ниже величин наиболее близка к максимально возможной продолжительности записи?
1) 17 секунд 2) 44 секунды 3) 65 секунд 4) 177 секунд
Решение:
1). Частота дискретизации К=48 кГц = 48 000 значений сигнала за секунду.
2). Глубина кодирования i=32 бит =4 байта.
3) Поскольку запись двухканальная, объём памяти, необходимый для хранения данных одного канала, умножается на 2, поэтому, так как размер файла I=16 Мб, один канал занимает 8 Мб =8·220 байт.
4). Продолжительность записи t = (8·220) / (48000*4) 43,69 сек.
Ответ: 2) 44 секунды
Задача 3:
Проводилась (моно) звукозапись с частотой дискретизации К=16 кГц = 16000 Гц и i = 32 бита. В результате был получен файл размером
I = 20 Мбайт.
Какая из приведенных ниже величин наиболее близка к времени, в течение которого проводилась запись?
1) 1 мин 2) 2 мин 3) 5 мин 4) 10 мин
Решение.
Глубина кодирования: i = 32 бита = 4 байта,
Размер файла: I = 20 Мб = 20*1024*1024 = 20 971 520 байт.
Время записи: t = I / (K∙i) = 20971520 / (16000 * 4) =
328 секунд / 60 = 5,5 минут, что близко к 5 минутам.
Ответ: 3) 5 мин
© ООО «Знанио»
С вами с 2009 года.