В презентации содержится материал по видам, основным характеристикам, назначению сканеров. Рассмотрен общий принцип работы и программное обеспечение по распознаванию текста. Данная презентация ориентирована на учителей информатики и педагогов, осуществляющих обучение студентов в области информационно-коммуникационных технологий. В материале содержатся фотографии, схемы.
Сканеры и программное
обеспечение распознавания
символов
Выполнил:
преподаватель АСК(ф)СахГУ
Сергиенко К.И.
Сканер (англ. scanner) — это устройство перевода
графической информации с твердого носителя в цифровой вид.
Прототип сканера был создан в 1857 году (пантелеграф).
В 1902 году известный немецкий физик по имени Артур Корн
в
придумал
фотоэлектрическом
Это изобретение впоследствии стали называть телефакс. Принцип
работы, заложенный в нем, стал основой и для современных
сканеров.
сканировании.
и
запатентовал
технологию,
применяемую
назначение
• Сканер оптикоэлектронное устройство, предназначенное
для ввода в компьютер графических изображений.
• Сканер создает оцифрованное изображение документа и
помещает его в память компьютера.
Основные характеристики сканеров
•Разрешение (Resolution) число точек или растровых ячеек,
из которых формируется изображение, на единицу длины или
площади.
•Измеряется в "точках на квадратный дюйм"
•(DPI, dots per inch). Типовое разрешение промышленных
сканеров 200300 DPI.
•Разрядность цвета количество разрядов каждого пикселя в
цифровом изображении. Описывает максимальное количество
цветов, воспроизводимое сканером в виде степени числа 2.
•Время сканирования измеряется в страницах в минуту.
•Формат сканируемого документа A3/A4.
•Интерфейс передачи данных могут быть различны (к COM
или USB порту, к SCSI карте и др.).
Принцип работы сканера:
Свет, отражаемый от объекта, благодаря системе
зеркал попадает на чувствительную матрицу, потом
на аналого-цифровой преобразователь и далее
передается компьютеру. Программное обеспечение
пошаговые полоски объекта объединяет в общее
изображение.
Сканер всегда сканирует в формате RAW. Потом
изображение конвертируется в общеиспользуемый
графический формат.
от
При конвертации применяются текущие настройки
тому подобного. В
яркости, контрастности и
зависимости
конвертация может
сканера
происходить как в самом сканере, так и в
компьютере. На
при
сканировании влияют такие аппаратные настройки
сканера, как уровни калибровки, время экспозиции
матрицы и т. п.
изображения
качество
Что такое системы распознавания?
Необходимо выполнить сканирование бумажных
документов и распознать их содержимое с
помощью специальных программ
(Optical Character Recognition OCR).
•Системы оптического распознавания символов
предназначены для
ввода
печатных документов в компьютер. Обработка
изображения OCRсистемой включает в себя
и
анализ
распознавание каждого символа.
автоматического
графического
изображения
Программное обеспечение сканирования
Существует три категории ПО сканирования:
• ПО сканирование малых объёмов документов
• ПО сканирования больших объёмов документов
• ПО для специальных задач сканирования
ПО сканирование малых объёмов документов.
Применяется при домашнем и офисном сканировании.
Используется практически любое программное обеспечение,
совместимое со стандартом TWAIN и поддерживающее функцию
сканирования.
TWAIN является стандартом для прикладного программного
интерфейса (API) таких периферийных устройств, как сканеры.
Примеры ПО сканирования малых объемов:
ABBYY FineReader
Adobe PhotoShop
•
•
• Cognitive Cuineiform
• Microsoft Photo Editor
•
ACDSEE
ПО сканирования больших объёмов документов.
Применяется при промышленном сканировании.
При поточном сканировании один сканер ежедневно может
Для
программного
используется
промышленный стандарт ISIS (ISIS Image and Scanner Interface
Specification).
обрабатывать до 50.000 и более документов.
управления
сканерами
сканировании.
устройства
Разрабатывается с учётом специфики сканирующего
ПО для специальных задач сканирования.
Применяется
при
планетарном,
высококачественном
Применяемое ПО:
ПланСкан BSC2
RZ ProScan Book (Minolta PS7000 edition)
Zeutschel OmniScan
Примеры применяемого ПО:
• Kofax Ascent Capture
• Captiva InputAccel
Точность распознавания
OCRсистемы могут достигать
наилучшей
точности
распознавания — свыше 99,9% для чистых изображений.
Если имеется приблизительно 1500 символов на странице,
то даже при коэффициенте успешного распознавания 99,9 %
получается одна или две ошибки на страницу. В таких случаях
на помощь приходит метод проверки по словарю.
Но это все равно не позволяет исправлять 100 % ошибок,
что требует человеческого контроля результатов.
Процессы анализа макета страницы:
• определение областей распознавания;
• определение таблиц;
• определение картинок;
• выделение в тексте строк и отдельных символов.
Планшетный сканер
наиболее распространённый вид сканеров
Достоинства:
высокое качество изображения
удобство в использовании
недорогая стоимости.
Планшетный сканер сканер, в котором оригинал кладется на
стекло и сканируется при помощи подвижной линейной
ПЗС матрицы.
Предназначены для ежедневного сканирования небольшого
объёма фотографий, слайдов или документов.
простота конструкции, ручная обработка документов, низкая
производительность.
Ручной сканер
Это портативный вариант сканера.
Достоинства:
•Мобильность
•Компактность
•Самодостаточность (Его можно использовать отдельно от
компьютера, все отсканированные изображения сохраняются
на карте памяти)
Недостатки:
•Низкое качество получаемых изображений
•Возможность перекоса при сканировании
Книжный сканер
предназначены для сканирования брошюрованных
документов.
Достоинства:
•Высокая скорость сканирования
•Функция "устранения перегиба" книги, которая
обеспечивает отличное качество отсканированного
изображения
Планетарный сканер
Применяются для
сканирования
книг,
скреплённых
документов, или легко повреждающихся документов.
Достоинства:
•При сканировании нет контакта со сканируемым объектом.
• Сканирование производится лицевой стороной вверх
таким образом позволяя повысить сохранность документов в
архиве.
•большая производительность при оцифровке книг и сшитых
оригиналов.
Протяжной или роликовый сканер.
• двустороннее сканирование (дуплекс)
• подсветка оригинала разными цветами для отсечки цветного фона
•
• модули динамической обработки разнотипных оригиналов
• надпечатывание отметки о том, что документ прошел обработку
система компенсации неоднородного фона
лист бумаги вставляется в щель и протягивается по
направляющим роликам внутри сканера мимо лампы.
Достоинства:
•имеет меньшие размеры, по сравнению с планшетным
•имеют устройство автоматической подачи, что позволяет быстро
сканировать большое количество документов
Недостатки:
•может сканировать только отдельные листы
Причины ошибок при
распознавании
• Грязные изображения
• Неаккуратное сканирование, связанное с
«человеческим фактором»
• Если документ был ксерокопирован, нередко
возникают разрывы и слияния символов.
• Страница, расположенная с нарушением
границ или перекосом, создает немного
искаженные
изображения,
которые могут быть перепутаны OCR.
символьные
СПИСОК ЛИТЕРАТУРЫ:
1. Бройдо В.Л., Ильина О.П. Архитектура ЭВМ и систем. Учебник для ВУЗов. 2е изд. СПб:
2.
Питер, 2009, 720 с.
Гинзбург А. Периферийные устройства: Принтеры, сканеры, цифровые камеры / А.Гинзбург,
М.Милчев, Ю.Солоницын. СПб.: Питер, 2001 . 448 с.
3. Жвалевский А.В. Ремонт и обслуживание компьютера. СПб.: Питер, 2009. 256 с.
4. Коджаспирова Г.М. Технические средства обучения и методика их использования. Учебное
пособие для студентов / Г.М.Коджаспирова, К.В.Петров. – М.: Академия, 2002. – 256 с.
5. Максимов Н.В., Партыка Т.Л., Попов И.И. Архитектура ЭВМ и вычислительных систем.
6.
Учебник для ВУЗов. 2е изд. М.: ФОРУМИНФРАМ, 2008. 512 с.
Резников Ф.Н.Быстро и легко. Сборка, диагностика, оптимизация и апгрейд современного
компьютера.: Учебное пособие. М.: Лучшие книги, 2003. 368 с.
http://lifeprog.ru/view_periferiynoe_ustroystvo.php?id=4
https://studfiles.net/preview/3976561/page:9/
7. Тучин В.В. Технические средства управления: Учебное пособие Сар.: Изд. СГСЭУ, 2006. 77 с.
8.
9.
10. https://tehpribory.ru/glavnaia/elektronika/skaner.html
11. http://tehznatok.com/kakvyibrat/skanera3planshetnyiy.html