Voco windows приложение для преобразования речи в текст

Язык распознавания

Русский

Объем базового словаря

334 750 слов и словоформ

Словари

Базовые: общетематический + разговорный
Тематические: юридический, финансовый

Точность распознавания

Диктовка: 86%*
Аудиозаписи с медийного канала: до 77%**

Рекомендуемые гарнитуры

Jabra UC Voice 550 Duo

Jabra UC Voice 550 Mono

Jabra Motion UC

Jabra Evolve 65 UC Duo

Поддерживаемые форматы аудиофайлов

wav, mp3

* Для гарнитур Jabra. Подготовленная речь
** Для новостного канала Euronews

Точность распознавания для различных моделей гарнитур

  • Jabra UC Voice 550 – 86%

  • Sennheiser Headset PC7 USB – 85%

  • Plantronics Blackwire — 84%

  • Genius I HS-02B – 74%

  • Ritmix RH-512M – 72%

Конфигурация ПК

Операционная система

Windows 7 64-бит
Windows 8 и 8.1 64-бит
Windows 10 64-бит

Оперативная память

Процессор

Core i5

Жесткий диск

Не менее 4 ГБ свободного пространства

Другие требования

  • Подключение к интернету для активации продукта и получения регулярных обновлений.

  • Звуковая карта, поддерживающая запись звука 16-бит.

  • Свободный USB-порт для подключения гарнитуры.

  • Microsoft Word 2010 32-бит или 2013 32-бит для версий Voco.Professional и Voco.Enterprise (для плагина преобразования аудиозаписей в текст).

Для активации ПО Voco необходим доступ к сети Интернет.

Voco — решение для преобразования речи в текст.

15 октября 2015 года компания Центр речевых технологий представила Voco – решение для преобразования речи в текст

Voco позволяет набирать текст голосом в любом текстовом поле, например: в MS Word, Skype, окне электронной почты. Это не просто распознавание голосовых команд или запросов — полноценное распознавание слитной речи, по скорости выигрывающее у опытного пользователя ПК в 1,5-3 раза.

Voco: Windows-приложение для преобразования речи в текст (2015)

Пользователь произносит сообщение для записи и распознанный текст появляется на экране. Знаки препинания и абзацы приложение расставляет по команде.

Расширенные версии Voco помогают распознавать текст из аудиофайла, помимо голосового набора. Конвертация выполняется в специальном плагине для редактора MS Word с отображением аудиозаписи в плеере и связью звука с распознанным текстом.

Российский рынок систем электронного документооборота за год вырос на 15% и достиг ₽95 млрд 212.3 т

Автоматическая текстовая расшифровка аудиофайлов поможет экономить время работающим с аудиозаписями: журналистам, юристам, переводчикам и специалистам многих других профессий. Чем лучше качество записи, тем, соответственно, точнее будет распознанный текст.

Распознавание речи в текст (2015)

Базовая версия Voco знает порядка 85 тыс. слов. Программу можно обучить при помощи своих документов и писем. Изучив их, Voco добавит в свой словарь часто используемые слова и выражения. Расширенные версии программы включают профессиональные словари.

Voco характерно автономностью. Выход в Интернет требуется для активации продукта или загрузки обновлений. Приложение пригодно для профессиональной работы с текстом. Возможности программы позволяют быстро набирать текст голосом, тратя минимальное количество времени на исправление ошибок. Автоматическая расшифровка аудиофайлов позволит оперативно перевести интервью, лекции и другие записи в текст.

Один из факторов, влияющих на качество распознавания – микрофон. Это может быть встроенный микрофон ноутбука. В комплекте с расширенными версиями Voco поставляются профессиональные модели гарнитур компании Jabra.

Программное обеспечение Voco представляет собой Windows-приложение для преобразования речи в текст. Решение Voco осуществляет голосовой набор текстов в любом текстовом поле, преобразовывает аудиофайл в текст, включает базовые и тематические словари, обучается на текстах пользователя. Программа выходит в версиях: Voco.Basic, Voco.Professional и Voco.Enterprise.

Основные функции Voco:

  • Распознавание осуществляется локально на компьютере пользователя, что обеспечивает работоспособность Voco даже при отсутствии сети. Подключение к Интернету требуется только для активации продукта и получения регулярных обновлений.
  • Каждая версия программы Voco включает базовый словарь общим объемом около 85 тысяч слов.
  • Расширенные версии программы включают тематические словари, количество которых постоянно пополняется. Можно также расширить словарный запас Voco: для этого надо указать документы и письма — программа выучит используемую лексику и стиль письма.
  • Voco Professional и Voco Enterprise позволяют осуществлять распознавание речи из аудиозаписей. Конвертация осуществляется в специальном плагине для редактора MS Word с отображением аудиозаписи в плеере и связью звука с распознанным текстом.
  • По команде программа установит нужный знак препинания, переведет курсор на новую строчку или вставит любой текст с помощью автозамены распознанной команды. При распознавании аудиофайлов знаки препинания будут расставлены автоматически.

Требования к текстовому редактору:

Для работы модуля транскрибирования, обеспечивающего распознавание речи из аудиофайлов, на компьютере должен быть установлен лицензионный текстовый редактор MS Word одной из следующих версий:

  • MS Word Standard 2010 x32/x64;
  • MS Word Professional Plus 2010 x32/x64;
  • MS Word Home & Business 2013 x32/x64;
  • MS Word Professional Plus 2013 x32/x64;
  • MS Word Professional Plus 2016 x32/x64;
  • MS Word 365 Business x32.

Требования к микрофону:

Ввод звука в компьютер осуществляется через микрофон, поэтому качество микрофона и звуковой платы оказывает влияние на точность распознавания. Высокое качество распознавания обеспечивают USB-гарнитуры и микрофоны. Точность распознавания для различных моделей гарнитур:

  • Jabra UC Voice 550 – 86%;
  • Sennheiser Headset PC7 USB – 85%;
  • Plantronics Blackwire – 84%;
  • Genius I HS-02B – 74%;
  • Ritmix RH-512M – 72%.

Не рекомендуется использовать встроенный в ноутбук или веб-камеру микрофон.

Требования к аудиофайлам

Точность преобразования записей речи в текст зависит от качества записывающего устройства, его близости к говорящему, фоновой шумовой обстановки, правильности речи. Для спонтанной неподготовленной речи, характерной для совещаний и «живого» общения, свойственны запинки, оговорки, перебивание собеседника или одновременный разговор нескольких людей, нечёткость произнесения и редуцирование слов. Распознавание речи, в отличие от мозга человека, не способно «отфильтровать» весь этот речевой мусор, и результат распознавания такой аудиозаписи может быть низким. Максимальная точность распознавания достигается на файлах, записанных на диктофоны серии Гном в режиме диктовки при расстоянии от губ до микрофона записывающего устройства не более 50 см. Также высокая точность распознавания достигается на файлах теле- и радиоэфира.

Аналоги VOCO

ContentCapture

ContentCapture — это решение для интеллектуальной обработки информации

Система АСПИАД предназначена для анализа рукописных материалов на предмет определения неоднородности почерка и принадлеж…

Программа MislabMedAI — это инновационное программное решение, разработанное для автоматизации распознавания медицинских…

1C:Распознавание первичных документов

1С:Распознавание первичных документов — решение для автоматического распознавания и внесения документов в систему 1С.

OCR-платформа SOICA распознает и извлекает информацию в печатных, рукопечатных и рукописных текстах в любых документах: …

Продукт создан для сбора мнения пользователей или аудитории о целевом объекте путем исследования огромного количества те…

Сервис занимается кластеризацией текстов, т.е. группирует их по темам и присваивающие каждой теме смысловое значение.

Dbrain IDP предлагает решение для быстрого и удобного преобразования сложных документов в структурированные данные.

RiDoc

RiDoc

от
Компания «Риман», ООО

RiDoc — программа для сканирования документов и распознавания текста.

WonderScribe

Решение для преобразования информации из аудиофайлов в текстовый формат и дальнейшего анализа текстовой информации

Master PDF Editor — программа, с помощью которой можно осуществлять создание, просмотр, сканирование и редактирование PD…

ITFB EasyDoc

Интеллектуальная платформа извлечения, анализа и генерации текстовых данных (OCR, IDP, LLM)

ContentReader — это серверное решение для распознавания и конвертации документов.

ReText PRO — это сервис, который помогает находить и исправлять орфографические ошибки в тексте.

RiDocLNX сканирует документы, делая отсканированный документ малого размера без потери качества изображения.

Цифровой ассистент, реализующий поиск по большим базам текстовых данных со встроенным инструментом анализа естественной …

Инструмент ESV Platform предназначен для автоматизации процесса обработки документов и извлечения значимых данных.

Scanitto

Scanitto — удобная программа для сканирования документов и фотографий для Windows с функцией редактирования изображений

OCR CuneiForm

OCR CuneiForm — программа для распознавания текста в сфотографированных и отсканированных документах.

ЕВФРАТ

от
Cognitive Technologies

ЕВФРАТ — это система электронного документооборота и автоматизации бизнес-процессов.

Мобильный ввод документов и распознавание текста на устройстве. Создавайте удобные условия для самообслуживания клиентов…

Microsoft Office Lens — Облачное решение, позволяющее компаниям конвертировать изображения, документы и содержимое интер…

Онлайн инструмент OCR, позволяющий предприятиям быстро переводить отсканированные документы в формат Excel, Word или RTF…

Понравилась статья? Поделить с друзьями:
0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
  • Контроллер atheros l1 gigabit ethernet 10 100 1000base t драйвер windows 10
  • Xcode simulator for windows
  • Как узнать название озу на windows 10
  • Windows automation scripts makegrid
  • Как убрать значок ярлыка с рабочего стола windows 10