Тема урока: Оценка количественных параметров текстового документа
Планируемые образовательные результаты
предметные – знание основных принципов представления текстовой информации в компьютере; владение первичными навыками оценки количественных параметров текстовых документов;
метапредметные - умения выделять инвариантную сущность внешне различных объектов;
личностные – способность применять теоретические знания для решения практических задач.
Решаемые учебные задачи:
рассмотрение основных принципов представления текстовой информации в компьютере (кодовые таблицы; ASCII, примеры кодирования букв национальных алфавитов; представление о стандарте Unicode);
вычисление информационного объема фрагментов текста.
Ход урока
1. Мотивирование к учебной деятельности.
2. Актуализация и фиксирование индивидуального затруднения в пробном учебном действии.
ОЦЕНКА
КОЛИЧЕСТВЕННЫХ
ПАРАМЕТРОВ
ТЕКСТОВЫХ
ОБРАБОТКА ТЕКСТОВОЙ
ДОКУМЕНТОВ
ИНФОРМАЦИИ
Ключевые слова
• кодовая таблица
• восьмиразрядный двоичный код
• информационный объём текста
Представление текстовой
информации в памяти
компьютера
Текст состоит из символов - букв, цифр, знаков
препинания и
которые компьютер
т.
различает по их двоичному коду.
Соответствие между изображениями символов и
кодами символов устанавливается с помощью
кодовых таблиц.Кодовая
таблица
д.,
ASCII
0 – 32 - управляющие
символы
33 – 127 – латинские буквы,
знаки препинания, цифры,
знаки арифметических
операций
128 – 256 – буквы
национального
алфавита
Представление текстовой
информации в памяти
компьютера
Коды русских букв в разных кодировках
Фрагмент кодовой таблицы ASCII
й код
й код
код
код
десятичный
код
192
193
194
Двоичный
Кодировка
Символ Десятичны
Двоичный
Символ Десятичны
Соответствие между изображениями символов и
Символ
00110000
Пробел
0
кодами символов устанавливается с помощью
двоичный
десятичный
двоичный
00110001
!
1
кодовых таблиц.
код
00110010
#
2
$
3
00110011
11100001
11000000
А
00110100
*
4
11100010
11000001
Б
00110101
=
5
11110111
11000010
В
00110110
,
6
Стандарт кодирования символов Unicode позволяет
00110111
7
_
8
00111000
символ кодируется
В Unicode каждый
00111001
/
9
Такое
шестнадцатиразрядным
01001110
A
N
количество разрядов позволяет закодировать 65 536
010001111
B
O
различных символов: 216 = 65 536.
01010000
C
P
код
Windows
00100000
00100001
00100011
00100100
00101010
00101011
00101100
00101101
00101110
00101111
010000001
01000010
01000011
КОИ8
48
49
50
51
52
53
54
55
56
57
кодом.
78
79
80
пользоваться более чем двумя языками.
32
33
35
36
42
43
44
45
46
47
65
66
67
двоичным
код
225
226
247
-
I = Ki
Информационный объём
фрагмента текста
объём
информационный
I
сообщения
K – количество символов
i – информационный вес символа
В зависимости от разрядности используемой
кодировки информационный вес символа текста,
создаваемого на компьютере, может быть равен:
•8
битов
кодировка;
•6 битов (2 байта) - шестнадцатиразрядная
Информационный объём фрагмента текста -
кодировка.
это количество битов, байтов
(килобайтов,
мегабайтов), необходимых для записи фрагмента
оговорённым способом кодирования.
восьмиразрядная
(1
байт)
-
Информационный объём
фрагмента текста
байтом,
чему
определите,
Задача 1. Считая, что каждый символ кодируется
одним
равен
информационный объём следующего высказывания
Жан-Жака Руссо:
Тысячи путей ведут к заблуждению, к истине только один.
Решение
В данном тексте 57 символов (с учётом знаков
препинания и пробелов). Каждый символ кодируется
одним байтом. Следовательно, информационный объём
всего текста - 57 байтов.
Ответ: 57 байтов.
два
Информационный объём
фрагмента текста
Задача 2. В кодировке Unicode на каждый символ
отводится
Определите
информационный объём слова из 24 символов в
этой кодировке.
Решение.
I = 24 2 = 48 (байтов).
Ответ: 48 байтов.
байта.
Информационный объём
фрагмента текста
Задача 3. Автоматическое устройство осуществило
перекодировку информационного сообщения на
русском языке, первоначально записанного в 8-битовом
коде, в 16-битовую кодировку Unicode. При этом
информационное сообщение увеличилось на 2048
байтов. Каков был информационный объём сообщения
до перекодировки?
Решение
Информационный вес каждого символа в 16-битовой
кодировке в два раза больше информационного веса
символа в 8-битовой кодировке.
Поэтому при
перекодировании исходного блока информации из 8-
битовой кодировки в 16-битовую его информационный
объём должен был увеличиться вдвое, другими
словами,
исходному
информационному
Следовательно,
информационный объём сообщения до перекодировки
величину,
на
равную
объёму.
Информационный объём
фрагмента текста
Задача 4. Выразите в мегабайтах объём текстовой
информации в «Современном словаре иностранных
слов» из 740 страниц, если на одной странице
размещается в среднем 60 строк по 80 символов
(включая пробелы). Считайте, что при
записи
использовался алфавит мощностью 256 символов.
I = K i
N = 2i
Решение
K = 740 80
60
N = 256
I - ? 256 = 2i = 28, i = 8
К = 740 80 60 8 = 28 416 000 бит = 3 552 000
байтов =
= 3 468,75 Кбайт 3,39 Мбайт.
Ответ: 3,39 Мбайт.
Самое главное
Текст состоит из символов - букв, цифр, знаков препинания
и т. д., которые человек различает по начертанию.
Компьютер различает вводимые символы по их двоичному
коду. Соответствие между изображениями и кодами
символов устанавливается с помощью кодовых таблиц.
В зависимости от разрядности используемой кодировки
информационный вес символа текста, создаваемого на
компьютере, может быть равен:
•8 битов (1 байт) - восьмиразрядная кодировка;
•6 битов (2 байта) - шестнадцатиразрядная кодировка.
Информационный объём фрагмента текста - это количество
битов, байтов (килобайтов, мегабайтов), необходимых для
записи фрагмента оговорённым способом кодирования.
кодировке
каждый
ASCII
битами.
8
Unicode?
Вопросы и задания
Сообщение занимает 6 страниц по 40 строк, в
В какой кодировочной таблице можно
В
символ
каждой строке записано по 60 символов.
закодировать 65 536 различных символов?
кодируется
Определите
Информационный объём всего сообщения
Считая, что каждый символ кодируется одним
Почему кодировки, в которых каждый символ
С какой целью была введена кодировка
В текстовом режиме экран монитора
Считая, что каждый символ кодируется 16
Сообщение, информационный объём которого
информационный объём сообщения в этой
равен 28800 байтам. Сколько двоичных
1)ASCII
кодируется цепочкой из восьми нулей и
компьютера обычно разбивается на 25 строк
байтом, определите, чему равен
битами, оцените информационный объем
равен 5 Кбайт, занимает 4 страницы по 32
кодировке:
разрядов было использовано на кодирование
единиц, называются иначе однобайтовыми?
по 80 символов в строке. Определите объём
информационный объём следующего
следующей фразы А. С. Пушкина в
строки, в каждой из которых записано по 40
2)Windows
текста, занимающего весь экран монитора, в
высказывания Алексея Толстого:
символов. Сколько символов в алфавите
3)КОИ-8
языка, на котором записано это сообщение?
1)32 бита
Не ошибается тот, кто ничего не делает, хотя это
Привычка свыше нам дана: Замена счастию она.
4)Unicode
1)44 бита
2)320 битов
1)512 битов
2)704 бита
3)32 байта
2)608 битов
3)44 байта
4)256 байтов
3)8 Кбайт
4)704 байта
4)123 байта
одного символа?
кодировке Unicode:
кодировке Unicode.
и есть его основная ошибка.
Длина данного текста 32 символа.
Опорный конспект
Компьютер различает вводимые символы по их
двоичному коду. Соответствие между изображениями и
кодами символов устанавливается с помощью кодовых
таблиц.
Информационный вес символа
8 битов
ASCII
Windows
КОИ8
I = K x i
16 битов
Unicode
-
объём
информационный
I
сообщения
K – количество символов
i – информационный вес символа
8 битов16 битовИнформационный вес символаWindowsUnicodeASCIIКОИ8