Оптическое распознавание текстов

  • docx
  • 14.11.2021
Публикация на сайте для учителей

Публикация педагогических разработок

Бесплатное участие. Свидетельство автора сразу.
Мгновенные 10 документов в портфолио.

Иконка файла материала Л2-01198.docx

Оптическое распознавание текстов

Сканер позволяет вводить графическую информацию с листа бумаги. В настоящее время существует потребность переноса текстовой информации с бумажных носителей (книги, журналы, газеты) в память компьютера и сохранения этой информации в текстовых файлах. Это во многом связано с созданием электронных библиотек, куда кроме современных изданий помещаются и издания, вышедшие в свет много лет назад и поэтому не имеющие электронной версии. После сканирования вся информация, в том числе и текстовая, представлена как изображение. Такой текст можно просмотреть, распечатать, а редактировать только с помощью графического редактора, который не обладает удобными средствами для работы с текстовой информацией.

Обычно при сканировании получают файл форматов TIFF, TGA, PCX или BMP. Для перевода в более общепринятый сегодня фор­мат JPEG используют специальные программы преобразования графических форматов — конверторы.

Программа сканирования обычно имеет следующие возможности:

1.                 перед началом работы можно задать режим сканирования: выбрать оптическое разреше­ние — обычно можно задать значения 300, 600, 1200 dpi (если сканер поддерживает разрешения до 1200 dpi) — и палитру — черно-белую, цветную (256 цветов), цветную с максимально воз­можным цветовым разрешением;

2.                 очень удобно использовать ре­жим предварительного сканирования. В этом режиме происходит быстрое сканирование изображения в режиме низкого разреше­ния, после чего пользователю предоставляется возможность выб­рать более точно область сканирования или поправить расположе­ние исходного изображения на планшете;

3.                 при скани­ровании можно сразу задать масштаб и применить несколько про­стейших фильтров.

Для преобразования изображения в текстовый документ предназначены специальные программы оптического распознавания текстов. Наиболее известной и часто используемой является программа Fine Reader (разработчик — фирма Abby). Можно сказать, что с помощью программ распознавания компьютер учится «читать» печатные и рукописные документы/