Язык распознавания |
Русский |
Объем базового словаря |
334 750 слов и словоформ |
Словари |
Базовые: общетематический + разговорный |
Точность распознавания |
Диктовка: 86%* |
Рекомендуемые гарнитуры |
Jabra UC Voice 550 Duo Jabra UC Voice 550 Mono Jabra Motion UC Jabra Evolve 65 UC Duo |
Поддерживаемые форматы аудиофайлов |
wav, mp3 |
* Для гарнитур Jabra. Подготовленная речь
** Для новостного канала Euronews
Точность распознавания для различных моделей гарнитур
-
Jabra UC Voice 550 – 86%
-
Sennheiser Headset PC7 USB – 85%
-
Plantronics Blackwire — 84%
-
Genius I HS-02B – 74%
-
Ritmix RH-512M – 72%
Конфигурация ПК
Операционная система |
Windows 7 64-бит |
Оперативная память |
|
Процессор |
Core i5 |
Жесткий диск |
Не менее 4 ГБ свободного пространства |
Другие требования |
|
Для активации ПО Voco необходим доступ к сети Интернет.
Voco — решение для преобразования речи в текст.
15 октября 2015 года компания Центр речевых технологий представила Voco – решение для преобразования речи в текст
Voco позволяет набирать текст голосом в любом текстовом поле, например: в MS Word, Skype, окне электронной почты. Это не просто распознавание голосовых команд или запросов — полноценное распознавание слитной речи, по скорости выигрывающее у опытного пользователя ПК в 1,5-3 раза.
Voco: Windows-приложение для преобразования речи в текст (2015)
Пользователь произносит сообщение для записи и распознанный текст появляется на экране. Знаки препинания и абзацы приложение расставляет по команде.
Расширенные версии Voco помогают распознавать текст из аудиофайла, помимо голосового набора. Конвертация выполняется в специальном плагине для редактора MS Word с отображением аудиозаписи в плеере и связью звука с распознанным текстом.
Российский рынок систем электронного документооборота за год вырос на 15% и достиг ₽95 млрд 212.3 т
Автоматическая текстовая расшифровка аудиофайлов поможет экономить время работающим с аудиозаписями: журналистам, юристам, переводчикам и специалистам многих других профессий. Чем лучше качество записи, тем, соответственно, точнее будет распознанный текст.
Распознавание речи в текст (2015)
Базовая версия Voco знает порядка 85 тыс. слов. Программу можно обучить при помощи своих документов и писем. Изучив их, Voco добавит в свой словарь часто используемые слова и выражения. Расширенные версии программы включают профессиональные словари.
Voco характерно автономностью. Выход в Интернет требуется для активации продукта или загрузки обновлений. Приложение пригодно для профессиональной работы с текстом. Возможности программы позволяют быстро набирать текст голосом, тратя минимальное количество времени на исправление ошибок. Автоматическая расшифровка аудиофайлов позволит оперативно перевести интервью, лекции и другие записи в текст.
Один из факторов, влияющих на качество распознавания – микрофон. Это может быть встроенный микрофон ноутбука. В комплекте с расширенными версиями Voco поставляются профессиональные модели гарнитур компании Jabra.
Программное обеспечение Voco представляет собой Windows-приложение для преобразования речи в текст. Решение Voco осуществляет голосовой набор текстов в любом текстовом поле, преобразовывает аудиофайл в текст, включает базовые и тематические словари, обучается на текстах пользователя. Программа выходит в версиях: Voco.Basic, Voco.Professional и Voco.Enterprise.
Основные функции Voco:
- Распознавание осуществляется локально на компьютере пользователя, что обеспечивает работоспособность Voco даже при отсутствии сети. Подключение к Интернету требуется только для активации продукта и получения регулярных обновлений.
- Каждая версия программы Voco включает базовый словарь общим объемом около 85 тысяч слов.
- Расширенные версии программы включают тематические словари, количество которых постоянно пополняется. Можно также расширить словарный запас Voco: для этого надо указать документы и письма — программа выучит используемую лексику и стиль письма.
- Voco Professional и Voco Enterprise позволяют осуществлять распознавание речи из аудиозаписей. Конвертация осуществляется в специальном плагине для редактора MS Word с отображением аудиозаписи в плеере и связью звука с распознанным текстом.
- По команде программа установит нужный знак препинания, переведет курсор на новую строчку или вставит любой текст с помощью автозамены распознанной команды. При распознавании аудиофайлов знаки препинания будут расставлены автоматически.
Требования к текстовому редактору:
Для работы модуля транскрибирования, обеспечивающего распознавание речи из аудиофайлов, на компьютере должен быть установлен лицензионный текстовый редактор MS Word одной из следующих версий:
- MS Word Standard 2010 x32/x64;
- MS Word Professional Plus 2010 x32/x64;
- MS Word Home & Business 2013 x32/x64;
- MS Word Professional Plus 2013 x32/x64;
- MS Word Professional Plus 2016 x32/x64;
- MS Word 365 Business x32.
Требования к микрофону:
Ввод звука в компьютер осуществляется через микрофон, поэтому качество микрофона и звуковой платы оказывает влияние на точность распознавания. Высокое качество распознавания обеспечивают USB-гарнитуры и микрофоны. Точность распознавания для различных моделей гарнитур:
- Jabra UC Voice 550 – 86%;
- Sennheiser Headset PC7 USB – 85%;
- Plantronics Blackwire – 84%;
- Genius I HS-02B – 74%;
- Ritmix RH-512M – 72%.
Не рекомендуется использовать встроенный в ноутбук или веб-камеру микрофон.
Требования к аудиофайлам
Точность преобразования записей речи в текст зависит от качества записывающего устройства, его близости к говорящему, фоновой шумовой обстановки, правильности речи. Для спонтанной неподготовленной речи, характерной для совещаний и «живого» общения, свойственны запинки, оговорки, перебивание собеседника или одновременный разговор нескольких людей, нечёткость произнесения и редуцирование слов. Распознавание речи, в отличие от мозга человека, не способно «отфильтровать» весь этот речевой мусор, и результат распознавания такой аудиозаписи может быть низким. Максимальная точность распознавания достигается на файлах, записанных на диктофоны серии Гном в режиме диктовки при расстоянии от губ до микрофона записывающего устройства не более 50 см. Также высокая точность распознавания достигается на файлах теле- и радиоэфира.
Аналоги VOCO
ContentCapture — это решение для интеллектуальной обработки информации
Система АСПИАД предназначена для анализа рукописных материалов на предмет определения неоднородности почерка и принадлеж…
Программа MislabMedAI — это инновационное программное решение, разработанное для автоматизации распознавания медицинских…
1С:Распознавание первичных документов — решение для автоматического распознавания и внесения документов в систему 1С.
OCR-платформа SOICA распознает и извлекает информацию в печатных, рукопечатных и рукописных текстах в любых документах: …
Продукт создан для сбора мнения пользователей или аудитории о целевом объекте путем исследования огромного количества те…
Сервис занимается кластеризацией текстов, т.е. группирует их по темам и присваивающие каждой теме смысловое значение.
Dbrain IDP предлагает решение для быстрого и удобного преобразования сложных документов в структурированные данные.
RiDoc
от
Компания «Риман», ООО
RiDoc — программа для сканирования документов и распознавания текста.
Решение для преобразования информации из аудиофайлов в текстовый формат и дальнейшего анализа текстовой информации
Master PDF Editor — программа, с помощью которой можно осуществлять создание, просмотр, сканирование и редактирование PD…
Интеллектуальная платформа извлечения, анализа и генерации текстовых данных (OCR, IDP, LLM)
ContentReader — это серверное решение для распознавания и конвертации документов.
ReText PRO — это сервис, который помогает находить и исправлять орфографические ошибки в тексте.
RiDocLNX сканирует документы, делая отсканированный документ малого размера без потери качества изображения.
Цифровой ассистент, реализующий поиск по большим базам текстовых данных со встроенным инструментом анализа естественной …
Инструмент ESV Platform предназначен для автоматизации процесса обработки документов и извлечения значимых данных.
Scanitto — удобная программа для сканирования документов и фотографий для Windows с функцией редактирования изображений
OCR CuneiForm — программа для распознавания текста в сфотографированных и отсканированных документах.
ЕВФРАТ
от
Cognitive Technologies
ЕВФРАТ — это система электронного документооборота и автоматизации бизнес-процессов.
Мобильный ввод документов и распознавание текста на устройстве. Создавайте удобные условия для самообслуживания клиентов…
Microsoft Office Lens — Облачное решение, позволяющее компаниям конвертировать изображения, документы и содержимое интер…
Онлайн инструмент OCR, позволяющий предприятиям быстро переводить отсканированные документы в формат Excel, Word или RTF…