Оценка количественных параметров текстовых документов

  • Презентации учебные
  • ppt
  • 06.05.2019
Публикация в СМИ для учителей

Публикация в СМИ для учителей

Бесплатное участие. Свидетельство СМИ сразу.
Мгновенные 10 документов в портфолио.

Тема урока: Оценка количественных параметров текстового документа Планируемые образовательные результаты предметные – знание основных принципов представления текстовой информации в компьютере; владение первичными навыками оценки количественных параметров текстовых документов; метапредметные - умения выделять инвариантную сущность внешне различных объектов; личностные – способность применять теоретические знания для решения практических задач. Решаемые учебные задачи: рассмотрение основных принципов представления текстовой информации в компьютере (кодовые таблицы; ASCII, примеры кодирования букв национальных алфавитов; представление о стандарте Unicode); вычисление информационного объема фрагментов текста. Ход урока 1. Мотивирование к учебной деятельности. 2. Актуализация и фиксирование индивидуального затруднения в пробном учебном действии.
Иконка файла материала 7-4-6 Оценка количественных параметров текстовых документов.ppt
ОЦЕНКА КОЛИЧЕСТВЕННЫХ ПАРАМЕТРОВ ТЕКСТОВЫХ ОБРАБОТКА ТЕКСТОВОЙ  ДОКУМЕНТОВ ИНФОРМАЦИИ
Ключевые слова • кодовая таблица • восьмиразрядный двоичный код • информационный объём текста
Представление текстовой информации в памяти компьютера Текст состоит из символов - букв, цифр, знаков препинания и которые компьютер т. различает по их двоичному коду. Соответствие между изображениями символов и кодами символов устанавливается с помощью кодовых таблиц.Кодовая таблица д., ASCII 0 – 32 - управляющие символы 33 – 127 – латинские буквы, знаки препинания, цифры, знаки арифметических операций 128 – 256 – буквы национального алфавита
Представление текстовой информации в памяти компьютера Коды русских букв в разных кодировках Фрагмент кодовой таблицы ASCII й код й код код код десятичный  код 192 193 194 Двоичный  Кодировка  Символ  Десятичны Двоичный  Символ  Десятичны Соответствие между изображениями символов и Символ  00110000 Пробел 0 кодами символов устанавливается с помощью двоичный  десятичный  двоичный  00110001 ! 1 кодовых таблиц. код 00110010 # 2 $ 3 00110011 11100001 11000000 А 00110100 * 4 11100010 11000001 Б 00110101 = 5 11110111 11000010 В 00110110 , 6 Стандарт кодирования символов Unicode позволяет 00110111 ­ 7 _ 8 00111000 символ кодируется В Unicode каждый 00111001 / 9 Такое шестнадцатиразрядным 01001110 A N количество разрядов позволяет закодировать 65 536 010001111 B O различных символов: 216 = 65 536. 01010000 C P код Windows 00100000 00100001 00100011 00100100 00101010 00101011 00101100 00101101 00101110 00101111 010000001 01000010 01000011 КОИ­8 48 49 50 51 52 53 54 55 56 57 кодом. 78 79 80 пользоваться более чем двумя языками. 32 33 35 36 42 43 44 45 46 47 65 66 67 двоичным код 225 226 247
- I = Ki Информационный объём фрагмента текста объём информационный I сообщения K – количество символов i – информационный вес символа В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен: •8 битов кодировка; •6 битов (2 байта) - шестнадцатиразрядная Информационный объём фрагмента текста - кодировка. это количество битов, байтов (килобайтов, мегабайтов), необходимых для записи фрагмента оговорённым способом кодирования. восьмиразрядная (1 байт) -
Информационный объём фрагмента текста байтом, чему определите, Задача 1. Считая, что каждый символ кодируется одним равен информационный объём следующего высказывания Жан-Жака Руссо: Тысячи путей ведут к заблуждению, к истине ­ только один. Решение В данном тексте 57 символов (с учётом знаков препинания и пробелов). Каждый символ кодируется одним байтом. Следовательно, информационный объём всего текста - 57 байтов. Ответ: 57 байтов.
два Информационный объём фрагмента текста Задача 2. В кодировке Unicode на каждый символ отводится Определите информационный объём слова из 24 символов в этой кодировке. Решение. I = 24  2 = 48 (байтов). Ответ: 48 байтов. байта.
Информационный объём фрагмента текста Задача 3. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 8-битовом коде, в 16-битовую кодировку Unicode. При этом информационное сообщение увеличилось на 2048 байтов. Каков был информационный объём сообщения до перекодировки? Решение Информационный вес каждого символа в 16-битовой кодировке в два раза больше информационного веса символа в 8-битовой кодировке. Поэтому при перекодировании исходного блока информации из 8- битовой кодировки в 16-битовую его информационный объём должен был увеличиться вдвое, другими словами, исходному информационному Следовательно, информационный объём сообщения до перекодировки величину, на равную объёму.
Информационный объём фрагмента текста Задача 4. Выразите в мегабайтах объём текстовой информации в «Современном словаре иностранных слов» из 740 страниц, если на одной странице размещается в среднем 60 строк по 80 символов (включая пробелы). Считайте, что при записи использовался алфавит мощностью 256 символов.  I = K  i N = 2i Решение K = 740  80  60 N = 256 I - ? 256 = 2i = 28, i = 8 К = 740  80  60  8 = 28 416 000 бит = 3 552 000 байтов =  = 3 468,75 Кбайт 3,39 Мбайт. Ответ: 3,39 Мбайт.
Самое главное Текст состоит из символов - букв, цифр, знаков препинания и т. д., которые человек различает по начертанию. Компьютер различает вводимые символы по их двоичному коду. Соответствие между изображениями и кодами символов устанавливается с помощью кодовых таблиц. В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен: •8 битов (1 байт) - восьмиразрядная кодировка; •6 битов (2 байта) - шестнадцатиразрядная кодировка. Информационный объём фрагмента текста - это количество битов, байтов (килобайтов, мегабайтов), необходимых для записи фрагмента оговорённым способом кодирования.
кодировке   каждый ASCII  битами. 8 Unicode? Вопросы и задания Сообщение занимает 6 страниц по 40 строк, в В какой кодировочной таблице можно В символ каждой строке записано по 60 символов. закодировать 65 536 различных символов? кодируется  Определите Информационный объём всего сообщения Считая, что каждый символ кодируется одним Почему кодировки, в которых каждый символ С какой целью была введена кодировка В текстовом режиме экран монитора Считая, что каждый символ кодируется 16 Сообщение, информационный объём которого информационный объём сообщения в этой равен 28800 байтам. Сколько двоичных 1)ASCII кодируется цепочкой из восьми нулей и компьютера обычно разбивается на 25 строк байтом, определите, чему равен битами, оцените информационный объем равен 5 Кбайт, занимает 4 страницы по 32 кодировке: разрядов было использовано на кодирование единиц, называются иначе однобайтовыми? по 80 символов в строке. Определите объём информационный объём следующего следующей фразы А. С. Пушкина в строки, в каждой из которых записано по 40 2)Windows текста, занимающего весь экран монитора, в высказывания Алексея Толстого: символов. Сколько символов в алфавите 3)КОИ-8 языка, на котором записано это сообщение? 1)32 бита Не ошибается тот, кто ничего не делает, хотя это  Привычка свыше нам дана: Замена счастию она. 4)Unicode 1)44 бита 2)320 битов 1)512 битов 2)704 бита 3)32 байта 2)608 битов 3)44 байта 4)256 байтов 3)8 Кбайт 4)704 байта 4)123 байта одного символа? кодировке Unicode: кодировке Unicode. и есть его основная ошибка. Длина данного текста 32 символа.
Опорный конспект Компьютер различает вводимые символы по их двоичному коду. Соответствие между изображениями и кодами символов устанавливается с помощью кодовых таблиц. Информационный вес символа 8 битов ASCII Windows КОИ­8 I = K x i 16 битов Unicode - объём информационный I сообщения K – количество символов i – информационный вес символа 8 битов16 битовИнформационный вес символаWindowsUnicodeASCIIКОИ­8