17 урок. 7 класс
Учитель: Брух Т.В.
Дата ____________
Тема урока: «Системы оптического распознавания документов. ПР №9».
Цель: сформировать представление обучающихся о приемах создания текстовых документов с использованием сканера и программ OCR.
Задачи:
Планируемые образовательные результаты:
Ход урока
1. Организационный момент
2. Актуализация (проблемная ситуация)
1. На прошлых уроках
мы учились форматировать символы, абзацы, таблицы, формулы.
Навык квалифицированного клавиатурного письма сегодня считается социальным,
общекультурным. Он важен в учебной деятельности и в повседневной жизни.
2. Очень часто возникает необходимость ввести в компьютер несколько страниц из книги, статью из журнала и т.д. Как вы поступите? (ответы учеников – затратить определенное время и просто набрать этот текст с помощью клавиатуры; сделать ксерокопию страниц).
3. Но чем больше исходный текст, тем больше времени будет затрачено на его ввод в память компьютера.
4. С помощью, каких устройств мы можем получить копию страницы из книги или журнала? (сканер, фотоаппарат, камера мобильного телефона)
5. В каком формате в этом случае мы получаем файл-копию (с помощью сканера можно получить изображение-картинку страницы текста, т.е. графический файл)
6. Текст можно будет читать, распечатывать, но нельзя будет его редактировать и форматировать. Поэтому для получения документа в формате текстового файла необходимо применить специальные программы, способные перевести изображение в подходящий для редактирования формат.
Такие программы называют OCR (это сокращение слов optical character recognition, "оптическое распознавание символов").
3. Изучение нового материала
– А теперь давайте сформулируем тему нашего урока «Системы оптического распознавания символов»
Ребята, давайте поставим цели урока, продолжив предложение:
Узнать (что?): как создать текстовый документ с использованием сканера и программ оптического распознавания символов
Научиться (чему?): получать изображение страницы текста с помощью сканера, проводить распознавание текста
Получить практические навыки работы с (какой программой?)
«Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе. Запишите это определение в тетрадь.
С помощью сканера несложно получить изображение страницы текста в графическом файле.
Если исходный документ имеет типографское качество (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений), то задача распознавания решается методом сравнения с растровым шаблоном.
Растровое изображение каждого символа последовательно накладывается на растровые шаблоны символов, хранящиеся в памяти системы оптического распознавания. Результатом распознавания является символ, шаблон которого в наибольшей степени совпадает с изображением. Например, распознаваемый символ "Б" накладывается на растровые шаблоны символов (А, Б, В и т. д.)
При распознавании документов с низким качеством печати (машинописный текст, факс и т.д.) используется метод распознавания структурных элементов (отрезков, колец, дуг и др.) символов. В искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов.
Например, распознаваемый символ "Б" накладывается на векторные шаблоны символов (А, Б, В и т. д.)
В тетради запишите, что для распознавания символов используют растровый и векторный метод (ученики записывают).
При проведении Единого государственного экзамена, при заполнении налоговых деклараций и т. д. используются различного вида бланки с полями. Рукописные тексты (данные вводятся в поля печатными буквами от руки) распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных.
С появлением первого карманного компьютера Newton фирмы Apple в 1990 году начали создаваться системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ.
Давайте подведем итоги теоретической части урока. Мы разобрались, с какой целью сохраняются печатные издания, что такое оптическое распознавание символов и поговорили о методах, применяемых в системах оптического распознавания символов. Все ли вам понятно?» (ответы учеников).
Давайте с вами узнаем, какие программы OCR существуют?
Наиболее распространенной программой оптического распознавания символов является ABBYY FineReader.
Упрощенно работу с программой распознавания символов можно представить так:
1. Бумажный носитель помещается под крышку сканера.
2. В программе
отдается команда –
создаётся цифровая копия исходного документа в формате графического файла
(изображение).
Замечание: так как цифровую копию документа можно получить, используя цифровой
фотоаппарат или камеру мобильного телефона, то в программе можно файл
изображение
3. В программе
отдается команда .
4. Распознанный текст
переносится в окно текстового редактора (например, Microsoft Word), для этого
отдается команда :
так как файл изображение можно либо получить с помощью сканера, либо открыть, то работа с программой ABBYY FineReader может начаться либо с команды сканировать либо с команды открыть
Далее учитель демонстрирует этапы работы с программой ABBYY FineReader (непосредственно в программе ABBYY FineReader).
На этапе распознавания учитель дает пояснения:
Сначала программа анализирует структуру документа, выделяя на его страницах блоки текста, таблицы, картинки.
Блоки - это заключенные в рамку участки изображения. Блоки выделяют для того, чтобы указать системе, какие участки, отсканированной страницы, надо распознавать и в каком порядке. Также по ним воспроизводится исходное оформление страницы. Блоки разных типов имеют различные цвета рамок.
Блоки текста, таблицы разбиваются на строки. Строки разбиваются на слова, а слова – на отдельные буквы. После этого программа сравнивает найденные символы с шаблонными изображениями букв и цифр, хранящимися в её памяти. В программу встроены словари, обеспечивающие более точный анализ и распознавание, а также проверку распознанного текста.
4. Первичное закрепление (практическая работа)
Теперь потренируемся работать с программой ABBYY FineReader.
Будем использовать упрощенную версию программы, поставляемую со сканером.
5. Закрепление изученного материала (практическая работа)
Практическая работа: Сканирование «бумажного» и распознавание электронного текстового документа.
Цель:
ознакомление с программой оптического распознавания текстов ABBYY Finereader 6.
Задание №1 «Сканирование и распознавание двух страниц любой книги средствами программы ABBYY Finereader»
Задание №2 «Распознавание уже имеющихся файлов или изображений в текстовый документ Word»
Каждый ученик получает ксерокопию страницы.
6. Подведение итогов урока
Вопросы:
7. Домашнее задание
Параграф 2.7
Материалы на данной страницы взяты из открытых источников либо размещены пользователем в соответствии с договором-офертой сайта. Вы можете сообщить о нарушении.