Время на прочтение7 мин
Количество просмотров559K
Если вы работаете в digital-маркетинге, вам постоянно нужно взаимодействовать с текстом: записывать идеи, задачи, описывать концепции, писать статьи и многое другое. Иногда проще и быстрее надиктовать текст, чтобы не забыть важную мысль или задачу. Диктофон для этого подходит плохо: запись потом нужно будет расшифровывать и переводить в текст. А если оставлять голосовые заметки часто, то потом просто нереально быстро найти нужную информацию или бегло ее просмотреть.
Голосовой ввод текста помогает решить эту проблему. Вы диктуете — программа сразу переводит речь в текст, который вы можете сохранить как обычную заметку и дальше работать с ней спокойно работать.
В статье мы собрали подборку бесплатных сервисов голосового ввода, которые помогут вам:
- быстро и удобно делать заметки, когда нет возможности или времени записывать вручную;
- записывать голосом список задач;
- надиктовывать черновики статей и других текстов.
Берите на вооружение сервисы из подборки и тестируйте — все они бесплатные и неплохо распознают русский язык.
5 бесплатных онлайн-сервисов для голосового ввода
1. SpeechPad
https://speechpad.ru/
Speechpad — бесплатный сервис для голосового ввода текста. Доступен в трех форматах:
- онлайн-сервис;
- браузерное расширение — с его помощью можно вводить текст в любое поле для ввода;
- мобильное приложение для Android и iOS.
У сервиса также есть платные функции. Их два вида:
- дополнительные (расширенные). Включают в себя голосовой ввод в режиме интеграции с OS Linux и Windows, а также транскрибирование аудиофайлов длиной более 15 минут;
- премиум. Пакетное транскрибирование аудио и видео (больше двух файлов).
Онлайн-сервис
Интерфейс сервиса выглядит так:
Здесь есть несколько настроек, кнопки управления и поле, в котором отображается распознаваемый текст.
Что можно сделать сделать:
- настроить язык голосового ввода. Базово с списке доступно 14 языков (среди них русский, украинский, английский, немецкий). Если нужен другой язык, необходимо зарегистрироваться в сервисе. После этого в личном кабинете появится возможность добавить этот язык (если для него поддерживается распознавание речи);
- активировать опцию «Включить команды». Если вы авторизованы в личном кабинете, вы можете добавлять голосовые команды и использовать их при надиктовке текста. Например, удалить последний распознанный фрагмент текста;
- отключить управление заглавными буквами Google. По умолчанию в речи распознается начало предложений и автоматически проставляются заглавные буквы. Вы можете отключить эту опцию и самостоятельно редактировать предложения.
Обратите внимание! Онлайн-сервис Speechpad корректно работает только в браузере Google Chrome. Можно запускать его и в Яндекс.Браузере, но все же для корректной работы рекомендуется использовать именно Chrome.
Для начала распознавания текста нажмите кнопку «Включить запись» и предоставьте доступ к микрофону.
Затем надиктовывайте текст. Сначала распознанные слова появятся в поле справа от кнопки «Включить запись». После небольшой паузы они попадут в поле ниже (результирующее поле).
Над результирующем полем есть кнопки со знаками пунктуации. По ходу диктовки вы можете добавлять их вручную.
После того как вы закончили диктовку, просмотрите текст, исправьте ошибки (если есть). Затем скопируйте текст или скачайте в виде txt-файла.
Транскрибация
Также с помощью Speechpad можно переводить аудиозаписи разговоров в текст с помощью опции «Транскрибация».
Здесь можно будет загрузить аудио- или видеофайл, а также добавить ссылку на видео с Youtube.
После нажатия на кнопку «Включить запись» файл начнет проигрываться и система переведет речь в текст.
Расширение SpeechPad
Установите расширение из магазина расширений Google Chrome. После установки в контекстном меню в браузере (при клике правой кнопкой мыши на любой области экрана) появится пункт «SpeechPad».
Кликните правой кнопкой мыши по любому полю для ввода текста и выберите расширение из контекстного меню. Поле подсветится, и вы сможете голосом произнести фразу, которую нужно ввести в поле. Расширение распознает ее и отобразит в виде текста.
Мобильное приложение
Доступно две версии: для Android и iOS.
Приложение может работать в автономном режиме (без подключения к интернету). Так выглядит интерфейс приложения на Android:
В настройках можно управлять голосовыми командами (для расстановки знаков препинания и спецсимволов с помощью голоса):
2. VoiceNote
https://voicenote.in/
VoiceNote — еще один сервис для преобразования голоса в текст, который работает только в Google Chrome (также может работать в Яндекс.Браузере). При попытке запустить его в другом браузере появляется сообщение об ошибке.
Для голосового ввода через VoiceNote можно использовать Live Demo или отдельное приложение для Chrome.
Как пользоваться сервисом
Откройте редактор и выберите язык, на котором нужно распознавать речь. Для этого кликните по иконке земного шара и укажите нужный язык.
Затем кликните по значку микрофона и предоставьте сервису доступ к микрофону вашего компьютера или ноутбука.
После этого система начнет запись и вы сможете надиктовывать текст. Распознанный текст появится в редакторе. Возможности:
- можно проговаривать знаки препинания словами;
- голосовой командой можно перевести текст на новую строчку;
- с помощью панели инструментов можно вручную добавлять знаки препинания и спецсимволы прямо во время диктовки;
- готовый текст можно отредактировать и сохранить в txt-файле.
3. Voice Notepad
https://dictation.io/speech
Еще один сервис для голосового ввода текста. Как и остальные сервисы, работает только в браузере Google Chrome.
У сервиса простой интерфейс. Здесь есть:
- возможность выбрать язык распознавания (сервис работает на основе движка Google Speech Recognition и может распознавать речь на более чем 100 языках);
- текстовое поле — здесь будет появляться распознанный текст, который можно отформатировать: выделить полужирным, курсивом или подчеркиванием, оформить списки, добавить или убрать отступы, задать выравнивание;
- кнопки управления — кнопка Start активирует распознавание речи. С помощью остальных кнопок можно копировать текст, сохранять в txt-файл, публиковать и совершать другие действия.
Сервис поддерживает голосовые команды. Например, с помощью команды можно перевести текст на новую строку, поставить тире или другие знаки препинания, спецсимволы и т. д.
Полный список поддерживаемых команд для русского языка — здесь.
4. Speechtexter.com
https://www.speechtexter.com/
Бесплатный онлайн-сервис для распознавания речи. Достаточно неплохо распознает русский язык. Всего поддерживает более 60 языков.
У SpeechTexter есть веб-версия (работает только в Google Chrome) и мобильное приложение для Android.
Для начала работы с сервисом необходимо выбрать язык распознавания и нажать кнопку Start (предоставив доступ к микрофону).
В текстовом поле есть несколько полезных функций:
- счетчик слов, распознанных системой;
- инструменты редактирования текста: выделение полужирным, курсивом, подчеркиванием, выравнивание текста, изменение размера шрифта. Также можно менять цвет текста, создавать нумерованные и ненумерованные списки;
- можно включить ночной режим — полезно, если вы используете сервис вечером или ночью.
В правой части интерфейса размещен блок со стандартными голосовыми командами для добавления знаков препинания и нового абзаца:
На вкладке Custom можно создать свои команды, например для добавления кавычек.
После завершения диктовки текст можно отредактировать и сохранить в файле:
- в txt-файле;
- документом Microsoft Word.
5. TalkTyper
https://talktyper.com/ru/index.html
Простой онлайн-сервис для голосового ввода с поддержкой 37 языков.
В этом сервисе минимум функций, однако с распознаванием русского языка он справляется вполне неплохо. Для начала распознавания речи необходимо нажать на значок микрофона, разрешить его использование в браузере и начать диктовку текста.
Если сервис распознал фразу неправильно, нажмите на значок «Варианты»:
Если среди предложенных вариантов нет правильного, текст можно поправить вручную.
После завершения распознавания вы можете сохранить текст в txt-файле, скопировать, распечатать или отправить на почту.
Дополнительные инструменты для голосового ввода текста
Яндекс.Клавиатура и GBoard (Google Клавиатура)
Если вы большую часть времени работаете со смартфона и хотите использовать возможность голосового ввода текста, воспользуйтесь функционалом голосового ввода, который есть в клавиатурах от Google и Яндекс:
- GBoard — клавиатура от Google. Для Android и iOS;
- Яндекс.Клавиатура. Для Android и iOS.
Так вы сможете надиктовывать текст в любом приложении, которое вы обычно используете для организации личных и рабочих заметок, задач и подобного (Google Keep, Notion, Trello и т. д.).
Воспользоваться голосовым вводом просто:
- Откройте нужное приложение (например, Google Keep) и создайте заметку;
- Откройте клавиатуру и нажмите на значок микрофона (ниже пример, как это сделать в GBoard);
- Начните диктовать заметку. Система распознает речь и преобразует ее в текст.
Голосовой ввод на GBoard (клавиатуре от Google)
Google Docs
Тем, кто много работает с Google Документами, пригодится встроенная функция голосового ввода (поддерживает русский язык).
Если вы еще не знали о ней, вот как ее включить: «Инструменты» → «Голосовой ввод».
Слева появится всплывающее окошко с выпадающим списком для выбора языка речи и кнопкой с иконкой микрофона.
Выберите нужный язык, нажмите на кнопку и начните диктовать текст.
Рекомендации, которые помогут улучшить качество распознавания текста
Все сервисы, которые мы привели в подборке, достаточно хорошо распознают русский язык, однако иногда качество распознанного текста может быть посредственным. Чтобы такого не происходило, следуйте нескольким базовым рекомендациям.
- Используйте хороший микрофон. Идеально, если у вас есть качественная гарнитура или внешний микрофон с шумоподавлением. Если же используете встроенный микрофон компьютера/ноутбука, убедитесь, что микрофон исправно работает, ничем не прикрыт, а вы находитесь достаточно близко, чтобы звук хорошо улавливался устройством.
- Произносите слова четко и неторопливо. Хорошая дикция определенно будет плюсом. Чем четче вы произносите слова, тем выше вероятность, что сервис сможет корректно распознать речь (даже если качество микрофона оставляет желать лучшего). Также не стоит произносит фразы слишком быстро, в этом случае часть слов может быть не распознана и текст придется редактировать.
- Позаботьтесь, чтобы вокруг вас не было посторонних звуков и шумов. Для качественного распознавания речи вокруг не должно быть музыки и других громких звуков.
Соблюдайте эти рекомендации и необходимость правок будет минимальной.
Любой пользователь компьютера может столкнуться с ситуацией, когда необходимо голосом ввести какой-либо текст на компьютере. Помимо стандартных решений Windows, существуют сторонние приложения, позволяющие сделать это. Предлагаем рассмотреть лучшие из них.
MSpeech
Первым делом рассмотрим бесплатную утилиту MSpeech от независимого разработчика Михаила Григорьева, распространяющего свой продукт бесплатно с открытым исходным кодом. В основе решения лежит технология Google Voice API, предназначенная для распознавания человеческой речи и дальнейшего ее преобразования в текст. Распознанный текст вводится в специальное окно, откуда его можно легко перенести в другие приложения разными способами. Поддерживается порядка 50 различных языков, включая русский. Доступны горячие клавиши для удобной активации и завершения записи.
Предусмотрен простой текстовый редактор, в котором можно выполнить первичную коррекцию полученного текста: заменить определенные слова другими или изменить первые буквы предложений на прописные. В качестве источника звука можно использовать любое устройство, подключенное к компьютеру. Если их несколько, то MSpeech предложит выбрать подходящее. Меню программы поддерживает русский язык. Помимо этого, она совместима со следующими интерфейсами: Microsoft SAPI, Google Text-to-Speech, iSpeech Text-to-Speech, Yandex Text-to-Speech и др.
Скачать MSpeech
Читайте также: Голосовой ввод текста на компьютере
Lossplay
На очереди еще одно простое приложение для транскрибации, которое изначально создавалось командой разработчиков с разных стран. Сейчас в качестве создателя выступает один независимый программист, продолжающий развивать его. LossPlay можно использовать не только для перевода голоса в текст, но и в качестве обычного плеера для прослушивания музыки и других аудиофайлов. Решение поддерживает любое актуальное расширение от MP3 до WMA. Управление воспроизведением осуществляется с помощью настраиваемых горячих клавиш.
LossPlay оптимизирован для работы с текстовыми документами Microsoft Word. Распознаваемый текст вводится в программе без участия пользователя. Помимо этого, предусмотрена функция автоматической вставки тайм-кодов всех фраз. Интерфейс рассматриваемого решения представлен в виде привычного плеера с дополнительными функциями. При этом с меню справится даже начинающий пользователь. LossPlay распространяется на бесплатной основе на русском языке.
Скачать LossPlay
Читайте также: Набираем текст голосом в Документах Гугл
Transcriber-Pro
Transcriber-Pro — программа от российских разработчиков, предназначенная для ручной расшифровки аудио и видеофайлов в текст. Присутствует встроенный текстовый редактор со всеми необходимыми функциями для качественной транскрибации: вставка временных меток и дикторов, простая навигация по записи, коррекция без повторного прослушивания, формирование профессиональное стенограммы и др. Управление осуществляется с помощью настраиваемых горячих клавиш, что делает решение более удобным.
Рассматриваемое приложение позволяет работать в команде над одним проектом. Предусмотрена оперативная техническая поддержка для обладателей платной лицензии. Подписка оформляется на год. На официальном сайте можно ознакомиться с системными требованиями, посмотреть наглядный видеоролик по работе с Transcriber-Pro, а также увидеть подробное руководство пользователя.
Скачать Transcriber-Pro
Читайте также: Программы для озвучки текста
Express Scribe
Express Scribe — многофункциональный инструмент для ручной расшифровки аудиозаписей, представленный в виде удобного плеера с дополнительными возможностями. В одном интерфейсе сосредоточен звуковой и текстовый модуль, что избавляет пользователя от необходимости переключаться между окнами. Среди примечательных особенностей стоит отметить возможность переключаться между звуковыми дорожками, переходить к конкретным ее частям, а также добавлять заметки с тайм-кодами.
Для открытия файла можно использовать директорию компьютера, FTP-сервер, компакт-диск, электронное письмо или внешние накопители. Помимо этого, Express Scribe поддерживает портативное аудиозаписывающее оборудование. Рассматриваемое решение работает с огромным количеством звуковых форматов: WAV, MP3, WMA, VOX, AU, DSS и др. Поддерживаются расширения диктофонов Philips Digital Recorder, GSM 6.10, ALaw, DSP и т. д. Стоит отметить, что некоторые форматы недоступны в демо-версии, а русский язык здесь вообще не предусмотрен.
Скачать Express Scribe
Это были наиболее надежные и популярные средства для перевода голоса в текст. Одни из них работают в автоматическом режиме, где достаточно загрузить аудиофайл или воспользоваться микрофоном, другие же представляют собой лишь вспомогательный инструмент, значительно упрощающий ручную транскрибацию.
Наша группа в TelegramПолезные советы и помощь
Выберите вариант загрузки:
- скачать с сервера SoftPortal (установочный exe-файл)
- скачать с сервера SoftPortal (portable-версия, zip-файл)
- скачать с официального сайта (установочный exe-файл)
- скачать с официального сайта (portable-версия, zip-файл)
Удобный в эксплуатации инструмент для автоматического преобразования речи в текст на различных языках. Помимо аудиофайлов (MP3, FLAC, WAV, OGG), это приложение также поддерживает видеофайлы, такие как MP4, WEBM, MKV, AVI, MPEG, MOV, WMV, FLV, TS (полное описание…)
Рекомендуем популярное
WinScan2PDF 9.34
Небольшая бесплатная портативная утилита, позволяющая сканировать документы с помощью…
Scan2PDF 1.7
Scan2PDF — небольшая программа, которая позволяет сканировать документы и изображения с…
Calibre 8.4.0 / 3.48.0
Calibre — незаменимое приложение для чтения электронных книг всех современных форматов, а…
14 инструментов для перевода голоса в текст
- Контент
Натали Азаренко
Автор «Конверта» и «свободный художник» на фрилансе
В маркетинге нужно постоянно работать с текстом: описывать концепции и тезисы, составлять брифы, придумывать вовлекающие и продающие формулировки. Это часто приходится делать прямо на ходу, когда под рукой нет ноутбука. В таких случаях свежую идею удобно наговорить голосом.
Расскажу про инструменты, которые делают работу с устным текстом проще. Программы для преобразования речи в текст позволяют надиктовать короткую заметку или объёмную статью. А функция транскрибации аудио и видеофайлов помогает в расшифровке длинных интервью и переговоров.
Что нужно сделать | Какой инструмент подойдёт |
Надиктовать текст в браузере | Google Документы, Speech to Text BOT, Speechpad, Yandex SpeechKit |
Надиктовать текст на смартфон | Google Keep, Dictation для iOS, Speechnotes для Android |
Транскрибировать аудио и видео | Speech2Text, Speechlogger, Vocalmatic, RealSpeaker, Google Документы, Speechpad, Summarize.Tech, Teamlogs, Аудио транскриптор |
Расшифровать аудио- и видеозапись вручную | Zapisano |
Для автоматической транскрибации аудио и видео
Ручная расшифровка аудио- и видеофайлов, как правило, занимает много времени. Надо прослушать небольшую часть записи, сделать паузу, записать, снова включить запись — и так много раз. Если доверить расшифровку специализированным сервисам, получение результата займёт столько же времени, сколько длится запись, или даже меньше.
Speech2Text
Онлайн-сервис, который переводит аудио и видео в текст со знаками препинания, абзацами и разделением на спикеров. Для расшифровки можно загружать файлы любого размера и длительности. Доступные форматы ― mp3, ogg, wma, mp4 и другие.
Кроме разделения на спикеров сервис проставит в готовом тексте ещё и таймкоды, если это необходимо
Возможности Speech2Text:
- Расшифрует даже записи с плохим звуком.
- Для обработки одного часа аудио или видео сервису требуется всего десять минут.
- Распознает более 20 языков: русский, английский, французский и другие.
- Доступна выгрузка в формате субтитров для легкого монтажа видео.
Важно: если после расшифровки вы удалите файлы, сервис не сохранит их у себя. Всё конфиденциально.
В подарок за регистрацию на сервисе вы получите три часа транскрибации. Но после того, как они закончатся, без оплаты будет доступно всего 15 минут в день.
Платные тарифы начинаются от 450 ₽ в месяц: например, за эту стоимость на «Старте» получите уже шесть часов расшифровки в месяц.
Аудио транскриптор
В сервисе можно расшифровать онлайн аудио- или видеофайлы в текст. Он точно умеет разделять текст по спикерам и делать таймкоды. Чтобы транскрибировать текст, нужно перетащить файл в поле или выбрать с компьютера. С коротким текстом справляется быстро: нужно меньше минуты.
Сервис суперточно разбил текст по спикерам, без ошибок транскрибировал текст на английском
С русским языком справился аналогично хорошо, правильно распознает паузы и расставляет знаки препинания
В бесплатной версии можно транскрибировать 3 файла в день, длительность — до 10 минут. В платной — можно скачивать текст в файле, смотреть краткое описание и загружать длинные аудио по 1,5 часа, например, с интервью или подкаста.
Помимо транскрибации аудио и видео в текст, сервис умеет контролировать качество звонков, например, менеджеров, также составлять протокол совещания и follow-up для клиента, транскрибировать аудио или видео на английском и сделать перевод на русский язык.
Speechlogger
Speechlogger преобразовывает голос в текст. Также его можно использовать как блокнот. В сервисе есть функция расшифровки аудио- и видеофайлов в форматах .aac, .m4a, .avi, .mp3, .mp4, .mpeg, .ogg, .raw, .flac, .wav.
Speechlogger работает с применением технологий искусственного интеллекта. При транскрибации автоматически проставляется пунктуация и временные метки. Для начала работы нужна авторизация через Google аккаунт.
В Speechlogger можно включить или отключить временные метки
Стоимость расшифровки — $0,1/минута. Минимальная сумма для пополнения баланса — $4,5. Время обработки соответствует длительности записи. Уведомление о готовности приходит на email. Точность расшифровки варьируется от 100 до 84% и зависит от качества записи.
Teamlogs
Онлайн-сервис транскрибации аудио и видео. Teamlogs расшифровывает любые файлы с голосом, автоматически расставляет знаки препинания, дефисы и даже кавычки-ёлочки. А еще он умеет делить текст по спикерам, расставлять тайм-коды и преобразовывать записи Zoom и Ms Office. Готовый текст можно экспортировать в форматах .docx, .xlsx и .srt.
Расшифровка речи платная, начинается от 7 руб/мин. Есть тестовая версия на 15 бесплатных минут расшифровки.
RealSpeaker
Сервис позволяет транскрибировать аудио- и видеофайлы длительностью до 180 минут. Для запуска расшифровки нужно выбрать язык записи, загрузить файл и запустить процесс. Готовый текст получается с ошибками, сервис склоняет не все слова, а некоторые вовсе пропускает.
Транскрибация платная — 8 руб./минута. Есть возможность потестировать сервис, поскольку 1,5 минуты расшифровки доступны бесплатно.
При транскрибации в RealSpeaker автоматически проставляются знаки препинания
Готовый текст можно подкорректировать в онлайн-редакторе, а затем скопировать или скачать в формате SRT или WebVTT. Стоит учитывать, что все результаты попадают в общее хранилище. Если в процессе загрузки файла оставить галочку «Сделать файл неудаляемым в течение 24 часов», то результат расшифровки нельзя удалить в течение суток. Если галочку убрать, то результат расшифровки можно удалить сразу после его копирования.
Для онлайн-конвертации голоса в текст
Онлайн-конвертеры помогают записывать текст голосом. Принцип таких сервисов примерно одинаков: вы чётко проговариваете слова, а система преобразует их в текст и записывает. Полученный результат, скорее всего, придётся отредактировать: проставить знаки препинания, проверить правильность написания сложных слов. Чтобы сократить объём редактуры, используйте высокочувствительный микрофон, медленно и разборчиво произносите слова.
Google Документы
Сервис Google Документы позволяет переводить устную речь в записанный текст. Это встроенная функция с поддержкой разных языков.
Для активации голосового ввода перейдите в раздел «Инструменты» и кликните на «Голосовой ввод».
Для использования голосового ввода в Google Документах не требуется установка плагинов
Затем нажмите на кнопку и говорите. Постарайтесь произносить слова медленно и чётко. Система умеет распознавать знаки препинания — просто говорите в нужных местах «Точка», «Запятая» и так далее. Также на русском языке можно использовать команды «Новая строка» и «Новый абзац». На английском языке перечень голосовых команд более обширный, полный список можно посмотреть в Справке.
Так выглядит результат голосового ввода от в Google Документах
Сервис неплохо конвертирует голос в текст при условии чёткого и правильного произношения. Но корректура всё равно может понадобиться — поправить регистр, проверить расстановку знаков препинаний и написание сложных слов.
Также в Google Документах можно транскрибировать аудио- и видеофайлы. Для этого включите воспроизведение файла на другом устройстве рядом с основным микрофоном. Способ работает, если речь в записи чёткая, разборчивая и не слишком быстрая. Для лучшего распознавания можно использовать замедленное воспроизведение.
Speech to Text BOT
Онлайн-сервис работает через браузер Chrome на десктопе и некоторых мобильных устройствах. Интерфейс интуитивно понятен: есть окно ввода текста, кнопка с микрофоном для запуска записи и список поддерживаемых команд.
Speech to Text BOT различает знаки препинания и заглавные буквы
Сервис поддерживает десятки разных языков. В настройках доступно форматирование текста: разные типа и размеры шрифта, написание предложений с заглавной буквы. Записанный текст можно редактировать, скачивать, отправлять в печать, копировать. Сервис неплохо переводит речь в текст при надиктовке, но не транскрибирует аудио- и видеофайлы, даже при их хорошем качестве.
Speechpad
Speechpad — удобный онлайн-блокнот для речевого ввода. Здесь можно надиктовывать текст на одном из пятнадцати доступных языков. Доступно параллельное форматирование текста: замена регистра, добавление знаков пунктуации и тегов. Но расставлять все придётся после записи: сам сервис ставить запятые и точки не умеет. Запись речи включается и выключается по необходимости.
После диктовки в Speechpad получился почти точный текст
Speechpad поддерживает преобразование в текст аудио- и видеозаписей. Для этого кликните на кнопку «+Транскрибацию» под полем ввода. После обновления страницы загрузите нужный файл, укажите ссылку или ID видео с YouTube. При необходимости настройте параметры: качество и скорость воспроизведения, указание временных меток, защиту от шумов. После этого можно включать запись. Результат преобразования в текстовом формате появится в окошке блокнота на этой же странице.
При конвертации записи в текст можно настраивать скорость воспроизведения, чтобы результат был более точным
Можно установить расширение, чтобы использовать голосовой ввод в любом текстовом поле браузера. Также есть модуль интеграции с Windows, Mac или Linux.
Summarize.Tech
Если вам нужно преобразовать видео с YouTube в текст и неважно, будет это дословно или нет, пользуйтесь сервисом Summarize.tech. Он работает на основе нейросети и за несколько секунд распознает любое видео, а затем делает краткую выжимку в несколько абзацев и дает подробное описание видео с тайм-кодами.
Правда, работает он на английском, поэтому полученный текст нужно прогнать через DeepL — переводчик на основе нейросети.
А уже потом можно добавить текст в озвучку. Так получается дольше, но результат получится лучше, чем у конкурентов.
Yandex SpeechKit
Это бесплатный сервис по распознаванию речи от Яндекса. В нём нет редактора и он не умеет расшифровывать готовые аудиозаписи. Сервис умеет только распознавать надиктованный текст.
При этом он не ставит знаки препинания, а максимальная длина надиктованного текста не может быть больше минуты.
Для преобразования речи в текст на мобильных устройствах
Если нужно записать какую-то мысль или идею вдалеке от рабочего стола, используйте мобильные сервисы. С их помощью можно надиктовать текст, сохранить его или отправить в другое приложение.
Google Keep
Google Keep позволяет надиктовывать заметки голосом. Сервис преобразует речь в текст, который при необходимости можно отредактировать. Созданные заметки синхронизируются на разных устройствах одного аккаунта. Их можно открыть на телефоне или компьютере, через приложение или веб-версию, в Google Документах или в Gmail.
При записи текста голосом в Google Keep можно делать паузы
Заметки из Google Keep можно копировать в Google Документы и отправлять через email или в соцсети.
Dictation для iOS
Плюс этого приложения для iOS — в отсутствии ограничений по времени диктовки. Dictation поддерживает 40 языков, а надиктованный текст можно быстро перевести на другой язык.
В Dictation можно быстро писать заметки для соцсетей
Также приложение позволяет транскрибировать аудиофайлы. Все записи синхронизируются на разных устройствах при включенном iCloud. Надиктованными текстами можно делиться: отправлять в мессенджеры или по email.
Speechnotes для Android
Приложение Speechnotes работает на основе распознавания речи Google. Для начала записи достаточно кликнуть по кнопке микрофона и начать говорить. Некоторые знаки пунктуации можно озвучивать голосом, для других доступна встроенная клавиатура, которой можно пользоваться прямо в процессе надиктовки.
Результат надиктовки в Speechnotes требует совсем незначительной редактуры
Готовый текст можно отредактировать, сохранить, переслать, распечатать. В премиум-версии (от 1,5$) доступно создание клавиш для вставки самых используемых фраз.
Для ручной расшифровки аудио- и видеозаписей
Результат автоматической расшифровки почти всегда требует доработки — проставить знаки препинания, подправить термины, заменить неверное написание отдельных слов. Если времени на доработку материала нет и нужна идеальная расшифровка, лучше доверить преобразование записей живым людям. Можно поискать частного специалиста или воспользоваться услугами специализированного сервиса.
Zapisano
Zapisano — сервис профессиональной ручной расшифровки аудио и видео: транскрибацией занимаются не машины, а люди. Это обеспечивает качественный результат, отсутствие «мусора» и верную пунктуацию. Помимо русского сервис поддерживает и некоторые иностранные языки.
При расшифровке файлов в Zapisano тексты сразу редактируют
Стоимость расшифровки зависит от сложности документа и временного периода. Так в категории «Стандарт» обработка файла стоит от 19 до 50 рублей за минуту, а длительность расшифровки варьируется от пяти до одного дня. Чем сложнее материал и выше срочность, тем дороже услуга. Можно самостоятельно просчитать стоимость при помощи тарифного калькулятора.
Ни один сервис с автоматическим преобразованием речи в текст не заменяет качественной ручной транскрибации. В большинстве случаев результат придётся редактировать. Но инструменты для перевода голоса в текст могут пригодиться при создании быстрых заметок, надиктовке объёмных материалов или черновой расшифровке записей.
Эксклюзивы
Читайте только в Конверте
Свежие статьи
«Честно» — рассылка о том, что волнует и бесит
Искренние письма о работе и жизни, эксклюзивные кейсы и интервью с экспертами диджитала.
Дата обновления: 24.10.2024
Время чтения: 15 мин.
Эльвина Амирханова
ЭКСПЕРТ
Редактор портала Otzyvmarketing.ru. Работаю в сфере интернет-маркетинга с 2010 года.
Транскрибация – это расшифровка информации из аудио- и видеозаписи и ее преобразование в текст. Она нужна в разных целях, например:
- Подготовка документации (запись бизнес-встреч, совещаний и пр.)
- Создание субтитров (текстовое сопровождение видеороликов)
- Конвертация информации (перевод данных из аудиозаписей и видеороликов в формат статей)
Обычно транскрибация проводится вручную – специалист включает аудио- или видеозапись, а затем перепечатывает услышанную информацию, оформляя ее в виде текстового документа. Так достигается высокое качество перевода.
Но ручная транскрибация занимает много времени, поэтому сейчас используют специальные сервисы для перевода информации из аудио или видео в текст. Некоторые из них упрощают ручную обработку файлов, а другие автоматически преобразуют аудиодорожку в текстовый формат.
Предлагаем вам подборку из 16 программ для транскрибации.
1. Speech2Text
Speech2Text – сервис для расшифровки записей на русском и на иностранных языках. Всего в базе более 20 языков. Подходит и для частного, и для профессионального использования.
Работает как с файлами, так и со ссылками – достаточно указать линк на видео. Транскрибация аудио происходит с использованием ИИ, поэтому скорость обработки высокая – часовую запись сервис переведет в текст за 10 минут. Машинное обучение позволяет выделять голоса разных спикеров.
При необходимости можно вывести результаты в файле docx или srt – второй вариант пригодится, если хотите создать субтитры для видео.
Доступна бесплатная версия, но есть и функционал, рассчитанный на использование в организациях – в этом случае можно предоставить доступ нескольким пользователям и запустить до 6 потоков распознавания речи одновременно.
Преимущества:
- Возможна интеграция через API.
- Есть бесплатная версия.
- Регистрация не обязательна.
- Высокое качество распознавания даже при фоновых шумах.
- Работает не только с файлами, но и со ссылками.
- Более 20 языков.
- Доступно создание субтитров.
- Есть плеер с тайм-кодами.
Недостатки:
- Нет мобильного приложения.
- Бесплатная версия ограничена 15 минутами в день.
Платформа | Стоимость | Возможность бесплатного использования |
Web |
|
15 минут в день |
2. Google Docs
Сайт: https://www.google.ru/intl/ru/docs/about/
Сервис для создания онлайн-документов и совместной работы над ними от Google. Поддерживает интеллектуальные технологии для быстрого написания текста, в том числе голосовой ввод, с помощью которого вы сможете переводить информацию из аудио в текст.
Для транскрибации нужно открыть документ, нажать «Инструменты» и выбрать «Голосовой ввод». На странице документа появится значок микрофона, где вы сможете выбрать язык. После этого останется нажать на значок и начать говорить – речь будет автоматически переводиться в текст и фиксироваться в документе.
Преимущества:
- Бесплатный сервис
- Текст сохраняется автоматически
- Вы можете быстро вносить корректировки в материал
Недостатки:
- Работает только в активном окне (т.е. не подходит для транскрибации аудио и видео из других вкладок)
- Не распознает некоторые слова
- Плохое качество транскрибации при работе с тихими или шумными записями
- Не поддерживает загрузку файлов
Платформа | Стоимость | Возможность бесплатного использования |
|
|
Доступно бесплатно для личного использования (функционал Google Документы доступен полностью) |
3. Speechpad
Сайт: https://speechpad.ru/
Голосовой блокнот, позволяющий вводить текст с помощью микрофона и преобразовывать речь из аудио- и видеозаписей в текст. По умолчанию текст вводится во встроенный редактор, но если настроить интеграцию с Windows, MacOS или Linux – голосовой ввод будет доступен в любые приложения (например, Microsoft Word).
Для транскрибации можно использовать видео с YouTube, а также аудио и видео HTML5. Во время расшифровки вы можете использовать защиту от шумов, запуск с меток, шаги перемотки и другие настройки.
Преимущества:
- Бесплатный сервис
- Поддерживает загрузку файлов для транскрибации и голосовой ввод с помощью микрофона
- Может воспринимать звук из других вкладок браузера
- Множество инструкций по транскрибации
- Можно быстро вносить корректировки в материал
Недостатки:
- Плохое качество транскрибации записей с дефектами, шумами и пр.
Платформа | Стоимость | Возможность бесплатного использования |
|
При использовании модуля интеграции с Windows, MacOS и Linux:
|
Доступно бесплатно |
4. Conspecto
Сайт: https://conspecto.ru
Удобный онлайн-сервис для конвертации разных медиафайлов в текст. Подходит для создания субтитров, конспекта. В работе участвует ИИ последней модели, что снижает количество опечаток. Платформа воспринимает свыше 300 разных форматов, работает с более 50 языками.
Начать транскрибацию можно без регистрации. Достаточно перетащить файл в указанную область на главной странице сайта или загрузить одним кликом. Результаты обработки можно будет просто скачать. Файл должен быть не тяжелее 2 Гб. Убедитесь, что на фоне нет музыки и посторонних шумов, а речь — чёткая.
Преимущества:
- Высокое качество транскрибации — мало ошибок
- Можно загружать как аудио, так и видео
- Площадка позволяет не просто провести транскрибацию, а сделать конспект
- Поддерживает очень редкие форматы (MOV, AAC)
- Есть телеграм-бот
- Для начала транскрибации не нужна регистрация
Недостатки:
- Всего 1 минута бесплатной транскрибации
- Нет голосового ввода
- Высокая стоимость
Платформа | Стоимость | Возможность бесплатного использования |
Web |
|
1 минута |
5. Any2text
Сайт: https://any2text.ru
Лёгкий для использования сервис. Регистрироваться для начала работы не нужно, нужно только зайти на главную сайта и перетащить файл. Можно также загрузить его одним кликом. Если файл хранится на Яндекс.Диске, Rutube, YouTube, достаточно дать ссылку.
Поддерживается работа с медиафайлами разных форматов, включая редкие. Скачать результат транскрибации можно в xlsx, docx, txt, srt. Сервис определяет язык автоматически, ничего указывать не нужно. Распознаёт более 50 языков. Есть реферальная ссылка (можно пригласить друга и получить 20% от его минут).
Преимущества:
- Высокое качество транскрибации, опечаток нет
- Регистрация для тестирования не требуется
- Автоматическое определение языка
- Поддерживает разные форматы
- Площадка проводит акции, есть реферальная программа
- Интерфейс предельно понятный
Недостатки:
- Нет мобильного приложения
- Отсутствует голосовой ввод
- Для транскрибации боле 15 минут нужна регистрации
Платформа | Стоимость | Возможность бесплатного использования |
Web | 5 рублей за минуту транскрибации, при пополнении баланса на 1000 рублей и выше — 4 рубля за минуту. | 15 минут |
6. Teamlogs
Сайт: https://teamlogs.ru
Простая в управлении платформа для транскрибации. Работает с видео и аудио. Поддерживает русский язык и английский, со временем количество языков обещают увеличить. Воспринимает большинство популярных форматов файлов.
Начать работать легко: достаточно зайти на сайт и загрузить файл. До 15 минут можно протестировать бесплатно. Сервис позволяет настроить доступ к файлу транскрибации и поделиться с ним при желании с другими.
Есть возможность редактировать получающийся результат прямо в браузере. Можно скачать файл с текстом в форматах XLSX, SRT и DOCX.
Преимущества:
- Большая скорость обработки — часовой файл за 6 минут
- Высокое качество, не больше 5% опечаток
- Сервис расставляет знаки препинания, делит текст на абзацы
- Выставление тайм-кодов
- Есть возможность генерации краткого конспекта-выжимки
- Формирование отчётов для юридических лиц
Недостатки:
- Только два поддерживаемых языка
- Готовый результат можно скачать всего в 3 форматах
- Нет приложения
Платформа | Стоимость | Возможность бесплатного использования |
Web | 6 рублей за минуту | Первые 15 минут (тестовые) |
7. WordVoice
Сайт: https://wordvoice.ru
Функциональный сервис для транскрибации со стильным дизайном. Для начала работы необходимо зарегистрироваться. Завести личный кабинет можно через ВК или электронную почту.
Пользователю выдаётся 90 рублей для пробной обработки, этого хватает на 18 минут. Загрузка происходит через специальное окно. Под ним — бокс для работы с иностранным текстом, доступен автоматический перевод. Результат транскрибации можно прочитать прямо в личном кабинете, скачать отдельным файлом.
Доступно озвучивание транскрибации: удобная фишка для тех, кому так комфортно проверять качество работы.
Преимущества:
- Высокое качество транскрибации
- Точная разбивка на тайм-коды, но в загруженном файле их нет
- Правильная расстановка знаков препинания
- Доступна озвучка результата транскрибации
- Высокая скорость обработки
- Воспринимает файлы в разных форматах
Недостатки:
- Нет разбивки по абзацам
- Не делит на спикеры
- Высокая цена (час транскрибации стоит 300 рублей)
Платформа | Стоимость | Возможность бесплатного использования |
Web | 5 рублей за минуту | Первые 18 минут (90 рублей тестовых после регистрации) |
8. RealSpeaker
Сайт: https://www.realspeaker.net/
Онлайн-сервис для транскрибации аудио- и видеофайлов в текст. Не поддерживает голосовой ввод с помощью микрофона. Для перевода необходимо выбрать язык (сервис поддерживает более 40 языков), загрузить файл (максимальная длительность – 3 часа) и дождаться окончания транскрибации. Время выполнения перевода зависит от длительности записи. После этого вы сможете обработать текст в редакторе, а также скачать субтитры (SRT или VTT). В разделе «Мои медиа» можно ознакомиться с расшифровками записей других пользователей – это позволит оценить качество транскрибации.
Преимущества:
- Высокое качество транскрибации
- Возможность оценить качество работы сервиса на основе расшифровок записей других пользователей
Недостатки:
- Платный сервис (исключение – записи длительностью до 1,5 минут)
- Не поддерживается голосовой ввод с помощью микрофона
- Открытый доступ в течение суток к расшифрованным файлам
- Только web-версия
Платформа | Стоимость | Возможность бесплатного использования |
Web | 8 рублей/минута | Транскрибация до 1,5 минут бесплатна |
9. oTranscribe
Сайт: https://otranscribe.com/
Онлайн-сервис для ручной расшифровки аудио- и видеозаписей. Поддерживает множество форматов (MP3, OGG, WEBM, WAV и пр.), а также YouTube-видео. С помощью oTranscribe вы сможете открыть файл или видео и начать вручную транскрибировать запись. Сервис позволяет приостанавливать воспроизведение, перематывать назад или вперед, не отрываясь от клавиатуры. Данные автоматически сохраняются в локальном хранилище вашего браузера. При необходимости можно экспортировать текст в Google Документы и др.
Преимущества:
- Бесплатный сервис
- Поддержка нескольких форматов и YouTube
Недостатки:
- Отсутствие автоматизации – расшифровка осуществляется вручную
Платформа | Стоимость | Возможность бесплатного использования |
Web | – | Поностью бесплатно |
10. Voco
Сайт: https://www.allrecord.ru/rech-v-tekst-programma-voco.aspx
Программа для преобразования речи в текст, поддерживающая голосовой ввод с помощью микрофона и загрузку аудиофайлов. Доступна ручная и автоматическая расстановка знаков препинания. Встроенный словарь Voco насчитывает более 85 тыс. слов. Программа изучает лексику и стиль пользователя, благодаря чему с течением времени работает в разы эффективнее. Распознавание речи происходит локально на компьютере пользователя, поэтому программа работает без подключения к сети (это необходимо только для установки обновлений).
Преимущества:
- Высокое качество транскрибации
- Поддерживает загрузку файлов и голосовой ввод
- Богатый функционал
- Программа адаптируется под лексику пользователя
Недостатки:
- Высокая стоимость
- Только для Windows
Платформа | Стоимость | Возможность бесплатного использования |
Windows |
|
Доступна 14-дневная пробная версия (полный функционал программы, кроме версии Enterprise) |
11. Transcriber Pro
Сайт: http://transcriber-pro.com/ru
Программа для ручной транскрибации аудиозаписей в текст. Вы можете управлять плеером с помощью горячих клавиш, а также использовать функции автотекста и простановки имен собеседников. Для удобной корректуры предусмотрены метки и простая навигация, вам не придется повторно прослушивать записи. Также вы можете разбивать задачи на подзадачи, выгружать их, объединять результаты в одном файле и многое другое.
Преимущества:
- Широкий функционал
Недостатки:
- Ручная транскрибация
- Средняя стоимость
- Только для Windows
- Не поддерживает видеозаписи
Платформа | Стоимость | Возможность бесплатного использования |
Windows | 799 руб. в год | – |
12. Lossplay
Сайт: https://dvorkin.by/lossplay/
Программа для ручной транскрибации аудио- и видеозаписей в текст, напоминающая знаменитый плеер Winamp. Поддерживает все основные форматы – MP3, MP4, WAV и др. Аудио- и видеофайлы воспроизводятся с помощью горячих клавиш. Вам не придется покидать окно текстового редактора. Программа позволяет вставлять шаблонные фрагменты текста, изменять скорость воспроизведения, кастомизировать интерфейс и многое другое.
Преимущества:
- Бесплатный сервис
- Широкий функционал
Недостатки:
- Ручная транскрибация
- Только для Windows
Платформа | Стоимость | Возможность бесплатного использования |
Windows | – | Поностью бесплатно |
13. Писец
Сайт: https://pisec.app
Лёгкий в освоении сервис для транскрибации аудио. Необходимости в регистрации нет. Достаточно просто зайти на сайт, загрузить файл, выбрать количество спикеров (от 1 до 5), после чего указать почту. Дальше сервис можно при желании закрыть: готовый результат придёт на обозначенный email.
Платформа не хранит медиафайлы, удаляет сразу после отправки. Поэтому беспокоиться о конфиденциальности информации не стоит. Сервис работает с любыми медиафайлами, включая редкие форматы.
Преимущества:
- Высокое качество транскрибации, опечаток не более 2%
- Сервис ставит таймкоды, удобно находить текст по конкретному месту в аудио
- Грамотно расставляет знаки препинания
- Воспринимает разные форматы, включая редкие
- Регистрация не нужна
- Бесплатная обработка — час в месяц
Недостатки:
- Большие очереди на бесплатную транскрибацию
- Отсутствует приложение
Платформа | Стоимость | Возможность бесплатного использования |
Web | Есть разные пакеты:
|
Час в месяц |
14. Dictation
Сайт: https://dictation.io/
Англоязычный онлайн-сервис для транскрибации, использующий распознавание речи от Google. Разработан в Индии. С его помощью вы можете преобразовывать речь на нескольких языках в текст, используя различные команды (например, «восклицательный знак», «тире» и пр.). Встроенный редактор позволяет форматировать сгенерированный текст, которым можно поделиться в соцсетях, по электронной почте или сохранить на компьютере.
Преимущества:
- Бесплатный сервис
- Можно быстро вносить корректировки
Недостатки:
- Только web-версия
- Не поддерживается загрузка файлов
- Слабое качество транскрибации
Платформа | Стоимость | Возможность бесплатного использования |
|
– | полностью бесплатно |
15. Express Scribe
Сайт: https://www.nch.com.au/scribe/index.html
Профессиональный аудиоплеер, предназначенный для расшифровки записей. Поддерживает более 40 форматов – MP3, M4A, DSS, WAV, MKV, MOV и пр. Вы можете загрузить файл с диска, FTP-сервера, e-mail и других источников, управлять горячими клавишами и специальной педалью управления (приобретается отдельно), переключать таймкоды и многое другое. Поддерживаются интеграции с текстовыми редакторами (например, Microsoft Word, Lotus Wordpro).
Преимущества:
- Высокое качество транскрибации (за счет фильтрации шумов и частот, работы с голосом и других инструментов)
- Поддержка большинства форматов
- Широкий функционал
Недостатки:
- Высокая стоимость лицензии
- Устаревший интерфейс
Платформа | Стоимость | Возможность бесплатного использования |
|
Лицензии:
|
Доступно бесплатно с ограниченным функционалом |
16. Transcribe
Сайт: https://transcribe.wreally.com/
Онлайн-сервис для ручной и автоматической транскрибации. Позволяет преобразовывать аудио- и видеозаписи на 80+ языках в текст. Также вы можете самостоятельно диктовать информацию в микрофон. Полученный текстовый файл можно экспортировать в формате субтитров (SRT, VVT) и DOC или TXT. При ручной транскрибации вы можете пользоваться специальными инструментами для замедления звука, зацикливания и т.д. Поддерживается интеграция ножной педали.
Преимущества:
- Высокое качество транскрибации
- Поддерживает загрузку файлов и голосовой ввод
- Поддерживает ручную и автоматическую транскрибацию
- Широкий функционал
- Поддержка большого количества файлов (как для импорта, так и для экспорта)
Недостатки:
- Высокая стоимость
Платформа | Стоимость | Возможность бесплатного использования |
Web | Тарифы:
|
Бесплатная пробная версия для ручной транскрибации, доступная в течение недели после регистрации |
Советы, как сделать транскрибацию максимально эффективно:
- Используйте хороший микрофон. Если вы преобразуете в текст собственную речь или аудиозапись на диктофоне – встроенный в ноутбук или веб-камеру микрофон покажет очень плохой результат. Лучше использовать отдельный микрофон (хотя бы классическую петличку).
- Правильно используйте автоматическую и ручную транскрибацию. Если качество записи оставляет желать лучшего – стоит транскрибировать ее в текст вручную. Ни одна программа не сможет преобразовать плохую речь, особенно в условиях фонового шума. Готовым решениям стоит доверять только высококачественные записи. Иначе вы потратите гораздо больше времени на корректуру.
- Снижайте скорость воспроизведения. Это уменьшает количество допускаемых ошибок.
- Используйте горячие клавиши. Они помогут не только отматывать запись, ставить ее на паузу и пр., но и работать с шаблонами. Если в речи постоянно повторяется одно и то же слово – его проще вставить, чем набирать вручную.
- Первичную корректуру старайтесь выполнять сразу же – в дальнейшем вам не придется искать нужный момент в записи, чтобы отредактировать текст. Окончательную редактуру нужно проводить после расшифровки всего текста.
Вам понравилась статья?
63
15