(Алфавитный подход)
Для измерения величин существуют эталонные единицы измерения.
Например:
Расстояние измеряют в миллиметрах, сантиметрах, дециметрах…
Массу измеряют в граммах, килограммах, тоннах…
Время измеряют в секундах, минутах, сутках, годах…
Следовательно, для измерения информации должна быть введена своя эталонная единица.
Позволяет измерять
Алфавитный подход к измерению информации
n Алфавит – весь набор букв, знаков препинания, цифр, скобок и других символов, используемых в тексте.
n
n Мощность алфавита - полное число символов в алфавите.
Например: мощность алфавита русских букв и используемых символов равна 54:
33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел.
Наименьшую мощность имеет алфавит, используемый в компьютере (машинный язык), его называют двоичным алфавитом,
т.к. он содержит только два знака «0», «1».
Информационный вес символа двоичного алфавита принят за единицу измерения информации и называется 1 бит.
При алфавитном подходе считают, что каждый символ текста, имеет информационный вес.
Информационный вес символа зависит от мощности алфавита.
С увеличением мощности алфавита, увеличивается информационный вес символа.
Для измерения объёма информации необходимо определить сколько раз информация равная 1 биту содержится в определяемом объёме информации.
Возьмём четырёхзначный алфавит (придуманный)
Четырёхзначный алфавит |
Символ |
☇ |
☊ |
☌ |
☍ |
Порядковый номер |
1 |
2 |
3 |
4 |
|
Двузначный двоичный код |
00 |
01 |
10 |
11 |
Все символы исходного алфавита можно закодировать всеми возможными комбинациями из двух цифр двоичного алфавита.
Алфавит мощностью 8 знаков можно закодировать на машинном языке с помощью трёх символов двоичного алфавита
Четырёхзначный алфавит |
Порядковый номер |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
Двузначный двоичный код |
000 |
001 |
010 |
011 |
100 |
101 |
110 |
111 |
Следовательно, каждый символ восьмизначного алфавита весит 3 бита.
Алфавит из шестнадцати символов можно закодировать с помощью четырёхзначного двоичного кода.
Какой объём информации содержат 3 символа 16 – символьного алфавита?
Решение:
1) Так как каждый символ алфавита мощностью 16 знаков можно закодировать с помощью четырёхзначного двоичного кода, каждый символ исходного алфавита весит 4 бита.
2) Так как всего использовали 3 символа алфавита мощностью
16 символов, следовательно: 4 бит ∙ 3 = 12 бит
3) Ответ: объём информации записанный 3 знаками алфавита мощностью 16 символов равен 12 бит
Запишем таблицу соответствия мощности алфавита (N) и количеством знаков в коде (b) - разрядностью двоичного кода.
Следовательно.
Информационный вес каждого символа, выраженный в битах (b), и мощность алфавита (N) связаны между собой формулой: N = 2b
Воспользуемся формулой N = 2b и узнаем мощность алфавита, в зависимости от объёма информации, содержащегося в одном символе данного алфавита.
*Используйте калькулятор.
Количество бит в одном символе алфавита |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Мощность алфавита |
2 |
4 |
8 |
16 |
32 |
64 |
128 |
256 |
512 |
1024 |
Если необходимо найти количество информации содержащееся в одном символе алфавита заданной мощности используют формулу b = log2 N
Алфавит из которого составляется на компьютере текст (документ) состоит из 256 символов.
Этот алфавит содержит символы: строчные и прописные латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания…
Из формулы N = 2b следует 256 = 28
Значит, каждый символ алфавита используемого в компьютере для печати документов весит 8 бит.
Эту величину приняли так же за единицу измерения информации и дали название байт.
Пример. Статья содержит 30 страниц, на каждой странице - 40 строк, в каждой строке 50 символов.
Какой объём информации содержит статья?
1) На каждой странице 50 ∙ 40 = 2000 символов;
2) во всей статье 2000 ∙ 30 = 60000 символов;
3) т. к. вес каждого символа равен 1 байту,
следовательно, информационный объём всей статьи
60000 ∙ 1 = 60000 байт или 60000 ∙ 8 = 480000 бит
Как видно из задачи байт «мелкая» единица измерения информационного объёма текста, поэтому для измерения больших объёмов информации используются более крупные единицы.
1 килобайт = 1 Кб = 210 байт = 1024 байт
1 мегабайт = 1 Мб = 210 Кб = 1024 Кб
1 гигабайт = 1 Гб = 210 Мб = 1024 Мб
Значит, если перевести результат предыдущей задачи в более крупные единицы измерения получим:
60000 байт ≈ 58,59375 Кб
60000 байт ≈ 0,057 Мб
© ООО «Знанио»
С вами с 2009 года.