Алфавитный подход
позволяет измерять информационный объем текста на некотором языке, не связанный с содержанием этого текста.
Единицы измерения
для расстояния – это метр,
для массы – грамм,
для времени – секунда.
Измерение происходит путем сопоставления измеряемой величины с единицей измерения.
Алфавитный подход
Алфавит – это набор букв, знаков препинания, цифр, скобок и других символов, используемых в тексте
Мощность алфавита – это полное число символов алфавита (N)
Например
Мощность алфавита из русских букв и отмеченных дополнительных символов равна 54:
33 буквы + 10 цифр + 11 знаков препинания + скобки + пробел.
Каждый символ текста имеет определенный информационный вес.
Информационный вес символа зависит от мощности алфавита.
Алфавитный подход
Единицы измерения информации
Двоичный код
это комбинация из нескольких (двух, трех и т.д.) знаков двоичного алфавита
Порядковый номер символа | 1 | 2 | 3 | 4 |
Двузначный двоичный код | 00 | 01 | 10 | 11 |
N | 2 | 4 | 6 | 8 |
b | 1 бит | 2 бита | 3 бита | 4 бита |
Порядковый номер числа | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
Трехзначный код | 000 | 001 | 010 | 011 | 100 | 101 | 110 | 111 |
N – мощность алфавита
b – разрядность двоичного кода
Разрядность двоичного кода и есть информационный вес символа
Если число N не равно целой степени двойки
то берется ближайшее к N, большее чем N значение M, равное двойке в целой степени:
Получаемое отсюда значение b принимается за информационный вес символа.
Например, если N=12, то M=16=24.
N
Информационный объем текста равен сумме информационных весов всех символов, составляющих текст
I = K * i
K – число символов в тексте
I – информационный объем текста
Материалы на данной страницы взяты из открытых источников либо размещены пользователем в соответствии с договором-офертой сайта. Вы можете сообщить о нарушении.