Кодирование текстовой информации

  • ppt
  • 06.05.2020
Публикация на сайте для учителей

Публикация педагогических разработок

Бесплатное участие. Свидетельство автора сразу.
Мгновенные 10 документов в портфолио.

Иконка файла материала 2. Кодирование текстовой информации.ppt

Кодирование текстовой информации

Создание документов в текстовых редакторах

Ввод и редактирование документа

Информация, выраженная с помощью естественных и формальных языков в письменной форме, обычно называется текстовой информацией.
Для представления текстовой информации (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы) достаточно 256 различных знаков.
По формуле можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак:

Двоичное кодирование текстовой информации в компьютере

Кодирование текстовой информации

Для обработки текстовой информации в компьютере необходимо представить ее в двоичной знаковой системе. Для кодирования каждого знака требуется количество информации, равное 8 битам, т.е. длина двоичного кода знака составляет восемь двоичных знаков. Каждому знаку необходимо поставить в соответствие уникальный двоичный код в интервале от 00000000 до 11111111 (в десятичном коде от 0 до 255).

Определение количества информации

Человек различает знаки по их начертанию, а компьютер – по их двоичным кодам. При вводе в компьютер текстовой информации происходит её двоичное кодирование, изображение знака преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу со знаком, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код знака). Код знака хранится в оперативной памяти компьютера.
В процессе вывода знака на экран компьютера производится обратное кодирование, т. е. преобразование двоичного кода знака в его изображение.

Присвоение знаку конкретного двоичного кода – это вопрос соглашения, которое фиксируется в кодовой таблице. Первые 33 кода в кодовой таблице (десятичные коды с 0 по 32) соответствуют не знакам, а операциям (перевод строки, ввод пробела и т. д.).
Десятичные коды с 33 по 127 являются интернациональными и соответствуют знакам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

Различные кодировки знаков

Десятичные коды с 128 по 255 являются национальными, т. е. в различных национальных кодировках одному и тому же коду соответствуют разные знаки. К сожалению, в настоящее время существуют пять различных кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Маc, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.
В последние годы широкое распространение получил новый международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов). По формуле определим количество символов, которые можно закодировать:

Такого количества символов оказалось достаточно, чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты.
Итак, в настоящее время имеется шесть различных кодировок для букв русского алфавита, в которых один и тот же знак имеет различные коды (табл. 2.2). К счастью, в большинстве случаев пользователь не должен заботиться о перекодировках текстовых документов, так как это делают специальные программы-конверторы, встроенные в операционную систему и приложения.

В алфавите формального (искусственного) языка всего два знака-буквы («0» и «Х»). Каждое слово этого языка состоит всегда из пяти букв. Какое максимальное число слов возможно в этом языке?
Алфавит племени содержит всего 8 букв. Какое количество информации несет одна буква этого алфавита?
Имеется тест, объем которого 20 килобайт (на каждой странице теста 40 строк по 64 символа в строке, 1 символ занимает 8 бит). Определить количество страниц в тесте.
Сколько байт в 32 Гбайт?

Задачи

Почему при кодировании текстовой информации в компьютере в большинстве кодировок используется 256 различных симво­лов, хотя русский алфавит включает только 33 буквы?
С какой целью ввели кодировку Unicode, которая позволяет за­кодировать 65 536 различных символов?

Вопросы

Создание документов в текстовых редакторах.
Ввод и редактирование документа.

Работа в текстовом редакторе MS Word.
Параметры страницы (поля, размер бумаги, расстояние до колонтитулов).
Форматирование абзацев (отступы, интервалы).
Выравнивание текста.
Нумерация страниц.
Изменения типа начертания шрифта.

Практическое задание

Набрать и отформатировать текст в MS Word так, как показано на следующем слайде.

Требования к формату текста документа:

Размер листа А5.
Размер и тип шрифта заголовка Times New Roman 18, остального текста 16.
Заголовок расположен по центру, остальной текст – по ширине листа.
Межстрочный интервал – полуторный.
Абзацные отступы – 1 см.
Размеры полей документа: верхнее, нижнее и правое – 1 см, левое – 1,5 см.
Страницы должны быть пронумерованы начиная с 0, «от центра», без номера на первой странице.
Текст должен быть набран с учётом всех правил и соблюдением типов начертания шрифта.

Некоторые полезные горячие клавиши MS Word

Расположение текста:
CTRL + R – по правому краю;
CTRL + L – по левому краю;
CTRL + E – по центру;
CTRL + J – по ширине страницы.

Тип начертания текста:
CTRL + B – жирный;
CTRL + U – подчёркнутый;
CTRL + I – курсив.

Другие:
CTRL + D – диалоговое окно «Шрифт»;
CTRL + H – диалоговое окно «Поиск и замена».
CTRL + Scroll мыши – изменение масштаба.