Измерение информации УД Информатика

  • Занимательные материалы
  • Контроль знаний
  • Образовательные программы
  • Работа в классе
  • Разработки уроков
  • pdf
  • 18.01.2017
Публикация в СМИ для учителей

Публикация в СМИ для учителей

Бесплатное участие. Свидетельство СМИ сразу.
Мгновенные 10 документов в портфолио.

Для измерения величин существуют эталонные единицы измерения Например: Расстояние измеряют в миллиметрах, сантиметрах, дециметрах… Массу измеряют в граммах, килограммах, тоннах… Время измеряют в секундах, минутах, сутках, годах… Следовательно, для измерения информации должна быть введена своя эталонная Алфавит – весь набор букв, знаков препинания, цифр, скобок и других символов, используемых в тексте единица. Существует два подхода к измерению информации
Иконка файла материала Измерение информации.pdf

(Алфавитный подход)


Как можно измерить количество информации?

Для измерения величин существуют эталонные единицы измерения.

                Например:  

 Расстояние измеряют в миллиметрах, сантиметрах, дециметрах…

 Массу измеряют в граммах, килограммах, тоннах…

 Время измеряют в секундах, минутах, сутках, годах… 

Следовательно, для измерения информации должна быть введена своя эталонная единица.

Существует два подхода к измерению информации

Содержательный   Алфавитный (вероятностный)

Позволяет измерять



Количество информации связывается с содержанием (смыслом) полученного сообщения или с учётом вероятности событий. информационный объём текста на любом языке (естественном или формальном) , при использовании данного подхода объём информации не связывают с содержанием текста, в данном случае, объём зависит от информационного веса символов.

 


Алфавитный подход к измерению информации


n   Алфавит – весь набор букв, знаков препинания, цифр, скобок и других символов, используемых в тексте.

 

n  


В алфавит включают и пробел (пропуск между словами).

n   Мощность алфавита - полное число символов в алфавите.

 

Например: мощность алфавита русских букв и используемых символов равна 54:

    33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел.

Наименьшую мощность имеет алфавит, используемый в компьютере (машинный язык), его называют двоичным алфавитом,

т.к. он содержит только два знака «0», «1».

Информационный вес символа двоичного алфавита принят за единицу измерения информации и называется  1 бит.



При алфавитном подходе  считают, что каждый символ текста, имеет информационный вес.

Информационный вес символа зависит от мощности алфавита.

С увеличением мощности алфавита, увеличивается информационный вес символа. 

Для измерения объёма информации необходимо определить сколько раз информация равная 1 биту содержится в определяемом объёме информации.

           Возьмём четырёхзначный алфавит (придуманный)


 

Четырёхзначный алфавит

Символ

Порядковый номер

1

2

3

4

Двузначный двоичный код

00

01

10

11

Все символы исходного алфавита можно закодировать всеми возможными комбинациями из двух цифр двоичного алфавита. 

Алфавит мощностью 8 знаков можно закодировать на машинном языке с помощью трёх символов двоичного алфавита

Четырёхзначный алфавит

Порядковый номер

1

2

3

4

5

6

7

8

Двузначный двоичный код

000

001

010

011

100

101

110

111

Следовательно, каждый символ восьмизначного алфавита весит 3 бита.

 


 Алфавит из шестнадцати символов можно закодировать с помощью четырёхзначного двоичного кода.

Какой объём информации содержат 3 символа 16 – символьного алфавита?

Решение:  

1)    Так как каждый символ алфавита мощностью 16 знаков можно закодировать с помощью четырёхзначного двоичного кода, каждый символ исходного алфавита весит 4 бита. 

2)    Так как всего использовали 3 символа алфавита мощностью

16 символов, следовательно: 4 бит ∙  3 = 12 бит

3)    Ответ: объём информации записанный 3 знаками алфавита мощностью 16 символов равен 12 бит    

Запишем таблицу соответствия мощности алфавита (N) и количеством знаков в коде (b) - разрядностью двоичного кода.

Следовательно. 

Информационный вес каждого символа, выраженный в битах (b), и мощность алфавита (N) связаны между собой формулой: N = 2b

Воспользуемся формулой N = 2b и узнаем мощность алфавита, в зависимости от объёма информации, содержащегося в одном символе данного алфавита.

*Используйте калькулятор.

Количество бит в одном символе алфавита

 

1

 

2

 

3

 

4

 

5

 

6

 

7

 

8

 

9

 

10

Мощность алфавита

 

2

 

4

 

8

 

16

 

32

 

64

 

128

 

256

 

512

 

1024

Если необходимо найти количество информации содержащееся в одном символе алфавита заданной мощности используют формулу b = log2 N

Алфавит из которого составляется на компьютере текст (документ) состоит из 256 символов.

Этот алфавит содержит символы: строчные и прописные латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания…

 

Из формулы N = 2b следует 256 = 28

Значит, каждый символ алфавита используемого в компьютере для печати документов весит 8 бит.

Эту величину приняли так же за единицу измерения информации и дали название байт.

8 бит = 1 байт

Пример. Статья содержит 30 страниц, на каждой странице - 40 строк, в каждой строке 50 символов.

Какой объём информации содержит статья?

1)    На каждой странице 50 ∙ 40 = 2000 символов;

2)    во всей статье 2000 ∙ 30 = 60000 символов;

3)    т. к. вес каждого символа равен 1 байту,

следовательно, информационный объём всей статьи

60000 ∙ 1 = 60000 байт или 60000 ∙ 8 = 480000 бит

  Как видно из задачи байт «мелкая» единица измерения информационного объёма текста, поэтому для измерения больших объёмов информации используются более крупные единицы. 

Единицы измерения информационного объёма

1 килобайт = 1 Кб = 210 байт = 1024 байт

1 мегабайт = 1 Мб = 210 Кб = 1024 Кб

1 гигабайт = 1 Гб = 210 Мб = 1024 Мб

 Значит, если перевести результат предыдущей задачи в более крупные единицы измерения получим: 

60000 байт ≈ 58,59375 Кб

60000 байт ≈ 0,057 Мб