Задача синтеза речи.

  • docx
  • 12.11.2021
Публикация на сайте для учителей

Публикация педагогических разработок

Бесплатное участие. Свидетельство автора сразу.
Мгновенные 10 документов в портфолио.

Иконка файла материала Л2-00836.docx

Задача синтеза речи. Часто бывает трудно или неудобно использовать экран для чтения текста (например, в транспорте), или хотелось бы получить информацию по голосовому каналу связи. В этом случае применяют программы синтеза речи.

Технически эти программы проще, чем программы распознавания, но безупречной их работу назвать сложно — “начитанный” такими программами текст часто оказывается неестественным и плохо воспринимается человеком. Трудности возникают при расстановке ударений, интонировании предложений и фраз, чтении неизвестных системе слов.

Тем не менее такие системы активно применяются во всевозможных автоинформаторах, когда набор используемых слов и фраз невелик.

Операционные системы Microsoft Windows в своем составе имеют общий интерфейс такого рода — MicrosoftSpeech. Для этого интерфейса могут быть разработаны системы произнесения текста — так называемого “голоса”. Интерфейс позволяет разрабатывать программы, использующие синтез речи. В частности, один из новых стандартов языков для разработки web-сайтов предусматривает голосовое взаимодействие — чтение страниц и распознавание команд перехода по ссылкам.

Задачи такого рода (распознавания образов в особенности) традиционно считаются задачами, связанными с областью искусственного интеллекта, то есть с воссозданием мыслительной деятельности человека. Разработка общих методов распознавания визуальных образов, речи человека, задача поиска решений и закономерностей в сложных ситуациях — задача, которую пытаются решить почти с самого момента появления ЭВМ.

Появление общего решения позволило бы принципиально увеличить возможности компьютеров, построить принципиально новую среду работы пользователя, решить огромное количество производственных задач.

В настоящий момент решений такого рода не существует. Современные методы создания обучающихся систем для распознавания образов в приведенных системах используются как дополнительные средства поиска решений.

Примеры программных средств

Abbyy FineReader, Dragon NaturallySpeaking, Corel Trace