Voco windows приложение для преобразования речи в текст

Язык распознавания	Русский
Объем базового словаря	334 750 слов и словоформ
Словари	Базовые: общетематический + разговорный Тематические: юридический, финансовый
Точность распознавания	Диктовка: 86%* Аудиозаписи с медийного канала: до 77%**
Рекомендуемые гарнитуры	Jabra UC Voice 550 Duo Jabra UC Voice 550 Mono Jabra Motion UC Jabra Evolve 65 UC Duo
Поддерживаемые форматы аудиофайлов	wav, mp3

* Для гарнитур Jabra. Подготовленная речь
** Для новостного канала Euronews

Точность распознавания для различных моделей гарнитур

Jabra UC Voice 550 – 86%
Sennheiser Headset PC7 USB – 85%
Plantronics Blackwire — 84%
Genius I HS-02B – 74%
Ritmix RH-512M – 72%

Конфигурация ПК

Операционная система	Windows 7 64-бит Windows 8 и 8.1 64-бит Windows 10 64-бит
Оперативная память
Процессор	Core i5
Жесткий диск	Не менее 4 ГБ свободного пространства
Другие требования	Подключение к интернету для активации продукта и получения регулярных обновлений. Звуковая карта, поддерживающая запись звука 16-бит. Свободный USB-порт для подключения гарнитуры. Microsoft Word 2010 32-бит или 2013 32-бит для версий Voco.Professional и Voco.Enterprise (для плагина преобразования аудиозаписей в текст).

Для активации ПО Voco необходим доступ к сети Интернет.

Источник

Voco — решение для преобразования речи в текст.

15 октября 2015 года компания Центр речевых технологий представила Voco – решение для преобразования речи в текст

Voco позволяет набирать текст голосом в любом текстовом поле, например: в MS Word, Skype, окне электронной почты. Это не просто распознавание голосовых команд или запросов — полноценное распознавание слитной речи, по скорости выигрывающее у опытного пользователя ПК в 1,5-3 раза.

Voco: Windows-приложение для преобразования речи в текст (2015)

Пользователь произносит сообщение для записи и распознанный текст появляется на экране. Знаки препинания и абзацы приложение расставляет по команде.

Расширенные версии Voco помогают распознавать текст из аудиофайла, помимо голосового набора. Конвертация выполняется в специальном плагине для редактора MS Word с отображением аудиозаписи в плеере и связью звука с распознанным текстом.

Российский рынок систем электронного документооборота за год вырос на 15% и достиг ₽95 млрд 212.3 т

Автоматическая текстовая расшифровка аудиофайлов поможет экономить время работающим с аудиозаписями: журналистам, юристам, переводчикам и специалистам многих других профессий. Чем лучше качество записи, тем, соответственно, точнее будет распознанный текст.

Распознавание речи в текст (2015)

Базовая версия Voco знает порядка 85 тыс. слов. Программу можно обучить при помощи своих документов и писем. Изучив их, Voco добавит в свой словарь часто используемые слова и выражения. Расширенные версии программы включают профессиональные словари.

Voco характерно автономностью. Выход в Интернет требуется для активации продукта или загрузки обновлений. Приложение пригодно для профессиональной работы с текстом. Возможности программы позволяют быстро набирать текст голосом, тратя минимальное количество времени на исправление ошибок. Автоматическая расшифровка аудиофайлов позволит оперативно перевести интервью, лекции и другие записи в текст.

Один из факторов, влияющих на качество распознавания – микрофон. Это может быть встроенный микрофон ноутбука. В комплекте с расширенными версиями Voco поставляются профессиональные модели гарнитур компании Jabra.

Источник

Программное обеспечение Voco представляет собой Windows-приложение для преобразования речи в текст. Решение Voco осуществляет голосовой набор текстов в любом текстовом поле, преобразовывает аудиофайл в текст, включает базовые и тематические словари, обучается на текстах пользователя. Программа выходит в версиях: Voco.Basic, Voco.Professional и Voco.Enterprise.

Основные функции Voco:

Распознавание осуществляется локально на компьютере пользователя, что обеспечивает работоспособность Voco даже при отсутствии сети. Подключение к Интернету требуется только для активации продукта и получения регулярных обновлений.
Каждая версия программы Voco включает базовый словарь общим объемом около 85 тысяч слов.
Расширенные версии программы включают тематические словари, количество которых постоянно пополняется. Можно также расширить словарный запас Voco: для этого надо указать документы и письма — программа выучит используемую лексику и стиль письма.
Voco Professional и Voco Enterprise позволяют осуществлять распознавание речи из аудиозаписей. Конвертация осуществляется в специальном плагине для редактора MS Word с отображением аудиозаписи в плеере и связью звука с распознанным текстом.
По команде программа установит нужный знак препинания, переведет курсор на новую строчку или вставит любой текст с помощью автозамены распознанной команды. При распознавании аудиофайлов знаки препинания будут расставлены автоматически.

Требования к текстовому редактору:

Для работы модуля транскрибирования, обеспечивающего распознавание речи из аудиофайлов, на компьютере должен быть установлен лицензионный текстовый редактор MS Word одной из следующих версий:

MS Word Standard 2010 x32/x64;
MS Word Professional Plus 2010 x32/x64;
MS Word Home & Business 2013 x32/x64;
MS Word Professional Plus 2013 x32/x64;
MS Word Professional Plus 2016 x32/x64;
MS Word 365 Business x32.

Требования к микрофону:

Ввод звука в компьютер осуществляется через микрофон, поэтому качество микрофона и звуковой платы оказывает влияние на точность распознавания. Высокое качество распознавания обеспечивают USB-гарнитуры и микрофоны. Точность распознавания для различных моделей гарнитур:

Jabra UC Voice 550 – 86%;
Sennheiser Headset PC7 USB – 85%;
Plantronics Blackwire – 84%;
Genius I HS-02B – 74%;
Ritmix RH-512M – 72%.

Не рекомендуется использовать встроенный в ноутбук или веб-камеру микрофон.

Требования к аудиофайлам

Точность преобразования записей речи в текст зависит от качества записывающего устройства, его близости к говорящему, фоновой шумовой обстановки, правильности речи. Для спонтанной неподготовленной речи, характерной для совещаний и «живого» общения, свойственны запинки, оговорки, перебивание собеседника или одновременный разговор нескольких людей, нечёткость произнесения и редуцирование слов. Распознавание речи, в отличие от мозга человека, не способно «отфильтровать» весь этот речевой мусор, и результат распознавания такой аудиозаписи может быть низким. Максимальная точность распознавания достигается на файлах, записанных на диктофоны серии Гном в режиме диктовки при расстоянии от губ до микрофона записывающего устройства не более 50 см. Также высокая точность распознавания достигается на файлах теле- и радиоэфира.

Источник

Аналоги VOCO

ContentCapture — это решение для интеллектуальной обработки информации

Система АСПИАД предназначена для анализа рукописных материалов на предмет определения неоднородности почерка и принадлеж…

Программа MislabMedAI — это инновационное программное решение, разработанное для автоматизации распознавания медицинских…

1С:Распознавание первичных документов — решение для автоматического распознавания и внесения документов в систему 1С.

OCR-платформа SOICA распознает и извлекает информацию в печатных, рукопечатных и рукописных текстах в любых документах: …

Продукт создан для сбора мнения пользователей или аудитории о целевом объекте путем исследования огромного количества те…

Сервис занимается кластеризацией текстов, т.е. группирует их по темам и присваивающие каждой теме смысловое значение.

Dbrain IDP предлагает решение для быстрого и удобного преобразования сложных документов в структурированные данные.

RiDoc

от
Компания «Риман», ООО

RiDoc — программа для сканирования документов и распознавания текста.

Решение для преобразования информации из аудиофайлов в текстовый формат и дальнейшего анализа текстовой информации

Master PDF Editor — программа, с помощью которой можно осуществлять создание, просмотр, сканирование и редактирование PD…

Интеллектуальная платформа извлечения, анализа и генерации текстовых данных (OCR, IDP, LLM)

ContentReader — это серверное решение для распознавания и конвертации документов.

ReText PRO — это сервис, который помогает находить и исправлять орфографические ошибки в тексте.

RiDocLNX сканирует документы, делая отсканированный документ малого размера без потери качества изображения.

Цифровой ассистент, реализующий поиск по большим базам текстовых данных со встроенным инструментом анализа естественной …

Инструмент ESV Platform предназначен для автоматизации процесса обработки документов и извлечения значимых данных.

Scanitto — удобная программа для сканирования документов и фотографий для Windows с функцией редактирования изображений

OCR CuneiForm — программа для распознавания текста в сфотографированных и отсканированных документах.

ЕВФРАТ

от
Cognitive Technologies

ЕВФРАТ — это система электронного документооборота и автоматизации бизнес-процессов.

Мобильный ввод документов и распознавание текста на устройстве. Создавайте удобные условия для самообслуживания клиентов…

Microsoft Office Lens — Облачное решение, позволяющее компаниям конвертировать изображения, документы и содержимое интер…

Онлайн инструмент OCR, позволяющий предприятиям быстро переводить отсканированные документы в формат Excel, Word или RTF…

Источник