Ввод информации с бумажных носителей информации с помощью сканера
Практическая работа
Цель: изучить назначение и типы сканеров; рекомендации по выбору сканера; приемы сканирования; технологию преобразования сканированных текстов в текстовые форматы; наиболее популярные программы распознавания сканированного текста; научиться сканировать текстовые и графические материалы; пользоваться программами распознавания и просмотра сканированного текста.
Задание:
1. Внимательно ознакомиться с теоретическим материалом/
2. Ответить на контрольные вопросы. Ответы оформить в текстовый редактор Word
Ход работы
Теоретическая часть
Сканер (англ. scanner) — устройство, которое, анализируя какой-либо объект (обычно изображение, текст), создаёт цифровую копию изображения объекта. Процесс получения этой копии называется сканированием. В зависимости от способа сканирования объекта и самих объектов сканирования существуют следующие типы:
Планшетные — наиболее распространённый вид сканеров, поскольку обеспечивает максимальное удобство для пользователя — высокое качество и приемлемую скорость сканирования. Представляет собой планшет, внутри которого под прозрачным стеклом расположен механизм сканирования.
Ручные — в них отсутствует двигатель, следовательно, объект приходится сканировать пользователю вручную, единственным его плюсом является дешевизна и мобильность, при этом он имеет массу недостатков — низкое разрешение, малую скорость работы, узкая полоса сканирования, возможны перекосы изображения, поскольку пользователю будет трудно перемещать сканер с постоянной скоростью.
Листопротяжные — лист бумаги вставляется в щель и протягивается по направляющим роликам внутри сканера мимо лампы. Имеет меньшие размеры, по сравнению с планшетным, однако может сканировать только отдельные листы, что ограничивает его применение в основном офисами компаний. Многие модели имеют устройство автоматической подачи, что позволяет быстро сканировать большое количество документов.
Планетарные сканеры — применяются для сканирования книг или легко повреждающихся документов. При сканировании нет контакта со сканируемым объектом (как в планшетных сканерах).
Книжные сканеры - предназначены для сканирования брошюрованных документов. Современные модели профессиональных сканеров позволяют значительно повысить сохранность документов в архивах, благодаря очень деликатному обращению с оригиналами. Современные технологии, используемые при сканировании книг и сшитых документов, позволяют добиваться высоких результатов.
Книжные сканеры с V-образной колыбелью на основе цифровых фотоаппаратов. Являются подвидом планетарных сканеров, однако имеют ряд отличий, среди которых - V- образная колыбель, позволяющая сканировать книгу, не раскрывая ее полностью, в режиме бережного сканирования, поэтому часто используется библиотеками. Прижимное стекло, входящее в состав конструкции, обеспечивает выпрямление страниц книги, и, следовательно, изображения без искажений.
Барабанные сканеры — применяются в полиграфии, имеют большое разрешение (около 10 тысяч точек на дюйм). Оригинал располагается на внутренней или внешней стенке прозрачного цилиндра (барабана).
Слайд-сканеры — как ясно из названия, служат для сканирования плёночных слайдов, выпускаются как самостоятельные устройства, так и в виде дополнительных модулей к обычным сканерам.
Сканеры штрих-кода — небольшие, компактные модели для сканирования штрих - кодов товара в магазинах.
Принцип действия планшетных сканеров: Сканируемый объект кладется на стекло планшета сканируемой поверхностью вниз. Под стеклом располагается подвижная лампа, движение которой регулируется шаговым двигателем. Свет, отраженный от объекта, через систему зеркал попадает на чувствительную матрицу (англ. CCD — Couple-ChargedDevice), далее на аналого-цифровой преобразователь и передается в компьютер. За каждый шаг двигателя сканируется полоска объекта, которые потом объединяются программным обеспечением в общее изображение.
Характеристики сканеров:
- оптическое решение - сканер снимает изображение, не целиком, а по строчкам. По вертикали планшетного сканера движется полоска светочувствительных элементов и снимает по точкам изображение строку за строкой. Чем больше светочувствительных элементов у сканера, тем больше точек он может снять с каждой горизонтальной полосы изображения. Это и называется оптическим разрешением. Обычно его считают по
- количеству точек на дюйм — dpi (dotsperinch). Сегодня считается нормой уровень разрешение не менее 600 dpi.
- скорость работы - В отличие от принтеров, скорость работы сканеров указывают редко, поскольку она зависит от множества факторов. Иногда указывают скорость сканирования одной линии в миллисекундах.
- глубина цвета - Измеряется количеством оттенков, которые устройство способно распознать. 24 бита соответствует 16 777 216 оттенков. Современные сканеры выпускают с глубиной цвета 24, 30, 36, 48 бит.
Практическая часть
Программа FineReader выпускается отечественной компанией ABBYY Software (www.bitsoft.ru). Эта программа предназначена для распознавания текстов на русском, английском, немецком, украинском, французском и многих других языках, а также для распознавания смешанных текстов.
Программа имеет ряд удобных возможностей. Она позволяет объединять сканирование и распознавание в одну операцию, работать с пакетами документов (или с многостраничными документами) и с бланками. Программу можно обучать для повышения качества распознавания неудачно напечатанных текстов или сложных шрифтов. Она позволяет редактировать распознанный текст и проверять его орфографию.
FineReader работает с разными моделями сканеров.
Включите сканер (если он имеет отдельный от компьютера источник питания). Внимание! Многие модели сканера необходимо включать до включения компьютера. Вставьте в сканер страницу, которую Вы хотите распознать.
Нажмите на стрелку справа от кнопки Scan&Read, в открывшемся локальном меню выберите пункт Мастер Scan&Read.
Мастер Scan&Read вызывает специальный режим, при котором Вы можете отсканировать и распознать страницу или открыть и распознать графическое изображение (пример графического файла Вы можете найти в папке Dio. Она находится в папке, в которую Вы установили FineReader). При этом каждый шаг сопровождается подсказками системы. Далее следуйте указаниям Мастера Scan&Read.
Процесс ввода документов в компьютер состоит из четырех этапов: сканирования, распознавания, проверки и сохранения результатов распознавания. В результате сканирования появится окно Изображение, содержащее "фотографию" страницы. Затем программа попросит Вас установить параметры распознавания и приступит к распознаванию изображения, одновременно анализируя его. Обработанные участки изображения закрашиваются голубым цветом. Результат распознавания Вы увидите в окне Текст. В этом же окне Вы можете проверить и отредактировать распознанный текст. Следуя далее указаниям Мастера Scan&Read, Вы можете либо передать распознанный текст в выбранное Вами приложение или сохранить его на диске, либо продолжить обработку следующих изображений.
Контрольные вопросы:
1. Назначение сканера.
2. Классификация сканеров.
3. Каким образом сканер подключается к компьютеру?
4. Назначение и типы систем распознавания образов.
© ООО «Знанио»
С вами с 2009 года.