Оптическое распознавание текстов

docx
14.11.2021

Публикация педагогических разработок

Бесплатное участие. Свидетельство автора сразу.
Мгновенные 10 документов в портфолио.

Добавить материал

Л2-01198.docx

Оптическое распознавание текстов

Сканер позволяет вводить графическую информацию с листа бумаги. В настоящее время существует потребность переноса текстовой информации с бумажных носителей (книги, журналы, газеты) в память компьютера и сохранения этой информации в текстовых файлах. Это во многом связано с созданием электронных библиотек, куда кроме современных изданий помещаются и издания, вышедшие в свет много лет назад и поэтому не имеющие электронной версии. После сканирования вся информация, в том числе и текстовая, представлена как изображение. Такой текст можно просмотреть, распечатать, а редактировать только с помощью графического редактора, который не обладает удобными средствами для работы с текстовой информацией.

Обычно при сканировании получают файл форматов TIFF, TGA, PCX или BMP. Для перевода в более общепринятый сегодня формат JPEG используют специальные программы преобразования графических форматов — конверторы.

Программа сканирования обычно имеет следующие возможности:

1. перед началом работы можно задать режим сканирования: выбрать оптическое разрешение — обычно можно задать значения 300, 600, 1200 dpi (если сканер поддерживает разрешения до 1200 dpi) — и палитру — черно-белую, цветную (256 цветов), цветную с максимально возможным цветовым разрешением;

2. очень удобно использовать режим предварительного сканирования. В этом режиме происходит быстрое сканирование изображения в режиме низкого разрешения, после чего пользователю предоставляется возможность выбрать более точно область сканирования или поправить расположение исходного изображения на планшете;

3. при сканировании можно сразу задать масштаб и применить несколько простейших фильтров.

Для преобразования изображения в текстовый документ предназначены специальные программы оптического распознавания текстов. Наиболее известной и часто используемой является программа Fine Reader (разработчик — фирма Abby). Можно сказать, что с помощью программ распознавания компьютер учится «читать» печатные и рукописные документы/

Материалы на данной страницы взяты из открытых источников либо размещены пользователем в соответствии с договором-офертой сайта. Вы можете сообщить о нарушении.

Посмотрите также