Голосовой переводчик на различные языки режим реального времени

Голосовой блокнот позволяет вводить текст, используя микрофон, а также переводить речь из аудио и видео в печатный текст. В настоящее время голосовой ввод возможен только в браузере Chrome для OS Windows, Mac и Linux (для пользователей Андроид и iOS разработаны специальные Android, iOS приложения). Для работы сервиса рекомендуется использовать внешний микрофон неплохого качества.

Голосовой набор текста

Нажмите кнопку “включить запись”. При первом посещении сайта вверху браузера возникнет панелька с просьбой разрешить доступ к микрофону. Нажмите там кнопку “Разрешить” Говорите в микрофон Кнопка A/a меняет регистр первой буквы слова, рядом с которым находится курсор Кнопка Отменить удаляет из результирующего поля последний введенный фрагмент Кнопки пунктуации служат для ввода знаков с помощью мыши Текст в результирующее поле добавляется после последней позиции курсора. Если был выделен фрагмент текста в результирующем поле, то введенный текст будет его заменять Установка флажка Отключить управление заглавными буквами Google отменяет простановку заглавных букв анализатором Google. Если отмечен флажок Заменять слова пунктуации, то слова в голосовом вводе, совпадающие со знаками препинания, будут заменяться на эти знаки. Соответствующие слова можно увидеть, если навести мышь на кнопку знака. *В настоящее время Google самостоятельно заменяет слова: точка, запятая, вопросительный и восклицательный знаки, поэтому при отключении флажка замена все равно может проводиться. Смена языка для голосового ввода осуществляется выбором соответствующего языка в выпадающем списке. Если языка нет в списке, но он поддерживается для голосового ввода, то его можно добавить в кабинете пользователя (доступен после регистрации) Если отмечен флажок Выполнять команды, то во время ввода текста можно давать команды голосом. Если отмечен флажок Вывод в буфер обмена, то текст будет поступать не в результирующее поле, а в буфер обмена. Флажок работает только при установленном расширении блокнота. Если отмечен флажок Возобновлять при ошибках, то запись не будет отключаться самостоятельно при ошибках и длительном молчании. –> Поле Уровень распознавания отображает качество распознавания речи или вид ошибки, если она возникла.

Ввод текста голосом любое поле ввода! Интеграция с Windows, Mac и Linux

Установив расширение для голосового блокнота, вы получите возможность вводить текст голосом в любое поле ввода напрямую. Добавив модуль интеграции c Windows, Mac или Linux, вы обеспечите прямой голосовой ввод во все приложения в этой OS.

Перевод аудио в текст

Кнопка Транскрибация включает панель воспроизведения звуковых и видео файлов. В настоящее время в голосовом блокноте доступен перевод аудиотекстов из форматов html5 видео и аудио, а также из видеозаписей youtube. Для форматов html5 видео и аудио необходимо указать URL медиа файла, для воспроизведения записи youtube нужно ввести ID этой записи в Youtube. После чего следует нажать на кнопку включить запись.

Снятие флажка Запускать синхронно с записью в модуле транскрибирования дает возможность самостоятельно проговаривать прослушиваемые фрагменты аудио или видео (при использовании наушников). Данная опция крайне полезна при плохом качестве роликов, когда автоматическое распознавание невозможно.

Видео инструкции по работе с системой

Обучающие видео по работе с голосовым блокнотом.

Приложения для голосового блокнота

Для удобства работы можно установить приложение CHROME или воспользоваться возможностями CHROME по созданию ярлыков приложений для запуска блокнота с предустановленными параметрами.

  Уровень распознавания  ? ?

–>

image

У меня появилась интересная задача — как сделать синхронный перевод видео с английского на русский язык.

«По рекомендации Google» я просмотрел тему транскрибации — перевод видео в текст или аудио записи в текст. Оказалось, что программы для транскрибации используются для удобства ввода текста с клавиатуры (нужно слушать аудио и набирать текст на клавиатуре), поэтому мне не подошли эти варианты.

Я нашел несколько вариантов, как с помощью современных технологий сделать перевод видео или аудио в текст, перевод этого текста и озвучивание.

Каждый сможет это повторить на своём компьютере. В этой статье я расскажу как перевести аудио или видео в текст и сделать синхронный перевод на любой язык. Так же, Вы узнаете больше о сервисах перевода речи в текст.

Перевод видео с помощью виртуального аудиодрайвера

Перевод видео с помощью виртуального аудиодрайвера

Решение для перевода видео или аудио

Современные технологии позволяют легко перевести речь через микрофон в текст и сделать перевод. Такие возможности по переводу речи в текст доступны, например, в сервисах Яндекс, Google и различных программах.

В этих программах нет «захвата» звука из видео или аудио, т.е. пользователю не предлагается перевести звук, который идёт на динамики компьютера. Как быть когда нужно перевести видео или аудио трансляцию?

Способ, который я использовал для перевода видео — это установка виртуального аудиодрайвера, который переключает звук динамиков на канал микрофона. После этого можно использовать обычные сервисы перевода речи в текст — они воспринимают звук видео или аудио, как речь идущую через микрофон. В итоге получаем текст из видео или аудио записи!

Недостатки этого метода в том, что во время работы виртуального драйвера динамики отключаются и не слышно исходной речи из видео или аудио файла. И второй момент — после окончания перевода, нужно отключить виртуальный драйвер аудио для восстановления настроек звука компьютера.

Установка программы виртуального аудио драйвера

Нужно скачать Виртуальный аудио драйвер на официальном сайте или Здесь.

image
Загрузка VB-CABLE Virtual Audio Device виртуального аудио драйвера на сайте

Установка драйвера простая — разорхивируйте скачанный файл. Далее, найдите в папке и запустите файл установки VBCABLE_Setup.exe (если этот файл не запустится, используйте VBCABLE_Setup_x64.exe).

После установки драйвера в настройках звука появятся новые устройства Cable Input (Воспроизведение) и Cable Output (Запись).

Виртуальный вход — новое устройство Воспроизведения в настройках Звука
Виртуальный выход — новое устройство Записи в настройках Звука
Как открыть настройки звука

Чтобы открыть Настройки звука и посмотреть устройства используйте команду

mmsys.cpl

Её нужно вставить в Меню Пуск — Выполнить (для открытия окна можно использовать комбинацию клавиш Win + R) или Поиск (будет предложен вариант — нажать на него для запуска настроек звука).

Открыть настройки звука с помощью команды

Перевод видео или аудио записи на любой язык

Сейчас я опишу поочерёдно все шаги, которые нужно сделать для онлайн перевода.

Включение виртуальных аудио устройств

Первое что нужно сделать — включить виртуальные устройства. Откройте настройки звука на закладке Воспроизведение запомните какое устройство выбрано по умолчанию (оно подписано и отмечено зелёной галочкой, на моём примере это Динамики) — это потребуется для возврата настроек. Далее, нужно выбрать CABLE Input и нажать кнопку По умолчанию.

Включение виртуального устройства Воспроизведения

После включения виртуального аудио драйвера в закладке Воспроизведение — откройте закладку Запись. Запомните какое устройство выбрано по умолчанию для восстановления настроек (на моём примере это Микрофон). Далее, нужно изменить устройство по умолчанию — выбрать CABLE Output, нажать кнопку По умолчанию и кнопку ОК.

Включение виртуального устройства Записи

Теперь виртульный аудио драйвер подключен и звук с динамиков перенаправляется в канал микрофона. Можно приступить к переводу видео или аудио. До возврата настроек звука динамики и микрофон не работают — как это сделать подробно описано ниже.

Сервисы перевода речи в текст

Теперь мы можем использовать любой сервис конвертирования речи в текст. После проверки, мне понравились как работают Яндекс переводчик (распознаёт текст на любом языке и может сделать синхронный перевод. Поле для ввода текста до 10 000 символов), Google переводчик (распознаёт текст на любом языке и может сделать синхронный перевод. Поле для ввода текста до 5 000 символов) и сайт Dictation (он хорошо записывает текст без перевода. Поле для ввода текста без ограничения).

Чтобы настроить конвертирование и перевод (если Вам нужно перевести текст) откройте любой из сайтов конвертирования речи в текст. Нужно выбрать исходный язык и язык перевода, включить микрофон. После этого можно включать видео или аудио на компьютере и начнётся автоматическое распознавание, запись текста и его синхронный перевод.

В сервисах Google и Яндекс не нужно нажимать Старт или Стоп — пока идёт аудио поток происходит конвертирование в текст. Когда в левом поле будет достигнут максимум символов, нужно остановить аудио и очистить левое окно с исходным текстом. После можно снова включить аудио и продолжить перевод.

На сайте Dictation для начала или окончания записи нужно нажать кнопку Start/Stop. Сервис работает очень хорошо и без ограничений количества входящего текста. После записи весь текст можно скопировать и перевести в переводчике.

Поздравляю, Вы всё сделали для начала перевода видео или аудио.

Напомню, что на время перевода микрофон и динамики не работают, после перевода нужно вернуть настройки звука.

Настройка сервисов для перевода Яндекс, Google, Dictation:

Настройка записи и перевода текста в Яндекс переводчике
Настройка записи и перевода текста в Google переводчике
Настройка записи текста в блокноте Dictation
Возвращение аудио настроек

После перевода, чтобы микрофон и динамики работали как обычно, верните прежние настройки звука на компьютере.

Откройте настройки звука. На закладке Воспроизведение нужно выбрать устройство, которое было по умолчанию до включения виртуального драйвера CABLE Input и нажать на кнопку По умолчанию. Затем, такие же действия нужно сделать на закладке Запись.

Вернуть устройство воспроизведения по умолчанию
Вернуть устройство записи по умолчанию

Всё готово — настройки звука в исходном состоянии! 

Перевод видео с помощью Youtube

В Youtube появилась возможность включить субтитры с переводом или получить весь текст видео для перевода. Я покажу эти два способа подробнее. 

Перевод видео с помощью субтитров Youtube

Для видео в котором хотите видеть перевод включите субтитры:

Кнопка включения субтитров

Далее, нужно открыть Настройки и нажать на строку Субтитры:

Настройка субтитров видео

В следующем окне нужно выбрать Перевести:

Перевод субтитров в видео Youtube

В следующем окне выберите язык, на который нужно сделать перевод субтитров видео. Всё, теперь субтитры будут с переводом, на понятном вам языке.

Перевод видео с помощью расшифровки текста Youtube

Можно получить весь текст видео. Для этого нужно использовать Расшифровку текста. Нажмите на три точки под видео и выберите Посмотреть расшифровку видео:

Открыть расшифровку текста в Youtube

Откроется окно с текстом видео (без перевода). Можно скопировать весь текст и после перевести. Чтобы в текст не попали временные метки, их нужно отключить:

Отключение временных меток

Далее, выделите в окне весь текст и скопируйте. 

копирование текста видео

Скопированный текст можно перевести, например в

Если Вам понадобился перевод аудио в текст, то Вам понадобятся программы для транскрибации. Можно конечно, и вручную переводить. Точнее “в ушную” 🙂 Но, согласитесь, это как-то сильно уж неправильно… Хотя я лично знаю таких вундеркиндов, которые зарабатывали на транскрибации без всяких программ некоторое время. Просто потому, что не знали, что они существуют 🙂 Но я отвлекся…

Итак. Для транскрибации, то есть перевода голоса в текст, можно использовать или программы, или специальные онлайн сервисы. Или комплексный вариант, оффлайн-программа + онлайн-сервис. Сейчас я расскажу, какие программы и сервисы для расшифровки аудиозаписей я знаю.

Содержание статьи:

Небольшое замечание! Я убрал ссылки на конкретные программы из текста статьи. Почему? Дело в том, что некоторые программы изменили ссылки. Другие выпустили новые версии. Короче, я это сделал, чтобы Вас не путать. Все указанные ниже программы легко находятся путем “загугливания” 🙂 . В крайнем случае напишите мне – подскажу..

Транскрибация вручную

Если Вы хотите экстрима, то попробуйте перевести речь в текст вручную. Даже если Вы планируете в дальнейшем для транскрибации активно использовать программы или сайты, о которых я расскажу ниже, все равно попробуйте это поделать “ручками”. Точнее “ушками”.

Это достаточно сложно. Точнее, технически-то, как раз ничего сложного нет. Берете аудиозапись, прослушиваете несколько секунд. Записываете. Возвращаетесь. Слушаете снова. Проверяете, все ли верно записали. И так следующий кусок. То есть, идея простая.

Сложность заключается в том, что сразу запомнить большой объем информации очень сложно. Вы играли когда-либо в “глухие телефончики”? 🙂 Вот такой же итог часто получается в случае “ручной транскрибации”, когда “переводчик” пытается запомнить сразу много информации.

Так зачем же я Вам советую попробовать ручную расшифровку аудио в текст? Дело в том, что какие-бы ни были классные программы для транскрибирования, о которых я буду рассказывать дальше, иногда они не могут помочь. Например:

  • В комнате шумно
  • Диктор говорит тихо
  • Диктор говорит с сильным акцентов
  • У диктора “фефекты фикции”
  • Записан на плохой микрофон
  • Одновременно говорит много людей
  • Диктор “вклинивает” иностранные фразы. Или малоупотребительные

Короче, “кочек”, на которых может застопориться Ваша программа масса. И в этом случае нужно подключать транскрибацию “вручную”.

Заказ перевода аудио в текст у специалистов

Вообще, мне достаточно часто нужна услуга по расшифровке аудиозаписей в текст. Нужно переводить в текст мои видеоуроки. Иногда я сначала наговариваю мысли для статьи на диктофон, а потом транскрибирую. Можно конечно заниматься этим самостоятельно с помощью программ, но это отнимает много времени. Почему? Потому что программы для транскрибации не всегда верно расшифровывают слова и приходится долго править полученный текст, форматировать его, вставлять знаки препинания и таймкоды.

Поэтому я нанимаю фрилансеров. Но.. И тут есть “засады”! Очень сложно найти “правильного” фрилансера, который бы делал все четко и в срок. И особенная проблема в том, что фрилансеры (особенно молодые) плохо дружат с русским языком. И часто делают еще больше ошибок, чем программы 🙁 Поэтому я стал искать специализированный сервис, который занимается ручным переводом аудио в текст. И чтобы качественно и недорого. И… Я похоже, нашел такую фирму.

Сервис расшифровки аудиозаписей в текст Zapisano.org

Сейчас я расскажу, чем мне приглянулся данный сервис. Итак, смотрим. Кстати, Все картинки увеличиваются по клику…

Это пока единственный российский сервис по транскрибации аудио с личными кабинетами, который “заточен” под бизнесменов, журналистов, юристов и т.п. То есть, для тех людей, для которых качество и скорость расшифровки аудиофайлов являются самыми важными факторами.

  • Начну с главного. C личного кабинета. Главный упор данного сервиса сделан на удобстве использования. Мне понравилось то, что можно заказ оформить прямо онлайн, тут же пообщаться с менеджерами и т.п. И все в одном месте. Не нужно никуда звонить, писать письма…Это здорово экономит время и нервы.
  • Цены на расшифровку аудио на удивление вменяемые. Причем, эти цены даны уже “под ключ”! Кстати, я провожу сравнение стоимости расшифровки на сервисе “Записано” с фрилансеровскими в моем видео внизу этого абзаца. Много интересных моментов выясняется. Рекомендую посмотреть!
  • Что еще? Есть работа с юр.лицами! Это просто супер! Можно платить по безналу по счету. А не искать наличку для платежа. Этого мне не хватало при работе с биржами фриланса.
  • Есть защита информации. У многих бесплатных программ транскрибации  Ваши данные могут уходить в “общий котел”. Это не есть зер гут! У “Записано” с этим все строго!

Из “приятных плюшек” хочу отметить еще три, особо мне понравившихся.

  • Тестовый заказ. Бесплатный. Для проверки качества работы этого сервиса. Можете попробовать, если не уверены в качестве расшифровки.
  • Работа с PayPal. Это означает, что с сервисом могут работать “забугорные” люди. Кстати, проблема с платежами, нередка в случае когда пытаются оплатить услуги российского сервиса из-за рубежа. Ну и PayPal дополнительно защищает Ваши покупки.
  • Работа с аудиозаписями из судов. Для меня это ничего не говорит, но мой друг, юрист, говорит, что это крутая фишка..

Короче, не буду навязывать Вам этот сервис. Лучше сами посмотрите и решите, стоит ли с ним работать.

Ссылка на сервис Zapisano.org– https://zapisano.org/

Ну и как обещал выше, рекомендую посмотреть это видео, где я подробней разбираю этот сайт.

А вот и подоспели итоги полной расшифровки моего видеоролика. Посмотрим, что получилось!

Ну а тем, кто все-таки хочет самостоятельно освоить все тонкости расшифровки аудио в текст, нужно читать дальше!

Субтитры Ютуб

Если Вам лень устанавливать какие-либо программы, а Вам нужно срочно провести транскрибацию аудиозаписи в текст, то… то просто воспользуйтесь Ютубом. Точнее субтитрами Ютуб. Как это сделать? Все просто.

Шаг 1. Залейте видео на свой канал Ютуб.

Шаг 2. Включите субтитры

Ша

Шаг 3. Нажать кнопку “Посмотреть расшифровку видео”

Шаг 4. Копируйте себе в блокнот полученный текст.

Шаг 5. Удалите метки времени и “причешите текст. Вот и все.

Субтитры Ютуб создает достаточно качественные. Единственное, много времени уходит на приведение текста в порядок. Но и в других программах, расстановка знаков препинания и приведение текста к нормальному виду тоже нужно делать. Так что…

Программа Express Scribe (Экспресс Скрайб)

Это наверное, одна из самых популярных программ для транскрибации

Программа на английском языку, но она интуитивно понятна. Кроме того, есть масса инструкций на Ютубе, как работать в ней.

В этой программе можно переводить аудиофайлы в текст. Эта программа позволяет удобно корректировать текст, изменять скорость прокрутки аудио. Можно поставить медленную скорость для того, чтобы писать под диктовку. Есть горячие клавиши для ускорения, пауз, перемотки и т.п. Можно делать метки тайм-кодов.

Express Scribe поддерживает все известные мне (и не известные 🙂 ) аудиофайлы… Без проблем интегрируется с Вордом. Короче, работать с программой очень приятно и удобно.

Но… она ограниченно бесплатная. То есть, некоторое время ей можно пользоваться, а потом она перестает работать. Нужно покупать. Или удалять и ставить заново. Если Вы собираетесь профессионально зарабатывать, то можно и потратиться на пробретение Экспресс Скрайб.

Программа Lossplay

Вот еще одна программа для профессиональной расшифровки аудиофайлов. Программа ЛоссПлей. Это плеер от “нашего” разработчика. Поэтому удобен для русскоязычного транскрибатора.

Программа идеально подходит для новичка, который занимается расшифровкой аудио. В программе есть удобные быстрые клавиши.Этот плеер для транскрибации легко интегрируется с Word.  Можно вставлять тайм-коды. Поддерживается огромное количество форматов аудиофайлов. Регулировка скорости воспроизведения. И многое-многое другое. Есть видеоуроки!

Сайт и программа Speechpad (Спичпэд)

Еще одна, любимая многими программа и одновременно онлайн-сервис. Голосовой блокнот Speechpad.

Можно заниматься транскрибацией прямо онлайн. На сайте. Можно установить расширение для Гугл Хром. Можно интегрировать это все в операционную систему для ввода в нужные программы. Кстати, это одна из немногих программ, которая работает в моем любимом Линукс Минт!

Вообще, функционал  сервиса SpeechPad воистину огромен. Давайте посмотрим на него внимательней:

  • Голосовой набор текста с микрофона. Кстати, этот сервис один из лидеров по правильному распознаванию речи (на мой взгляд). Ввод текста идет синхронно “говорению”. Можно по ходу сразу же править текст и вставлять знаки препинания.
  • Транскрибация с аудиофайла или прямо с ролика Ютуб. Достаточно указать путь к аудиофайлу или видеоролику, включить транскрибатор, и начнется перевод. Правда, у меня почему-то не всегда получается это с первого раза. Может, потому что стоит Линукс.
  • Есть озвучивание субтитров. Да и простого текста. Используется голос Гугл переводчика. Немного коряво, но в принципе “слушательно”
  • Можно делать проверку произношения. Это пригодится тем, кто изучает иностранный язык

Если внимательно посмотреть, то можно много чего еще найти в сервисе для перевода аудио в текст SpeechPad. Есть подробные видеоуроки по каждому пункту. Есть просто подсказки. Можно сохранить готовый текст в файлы.

И да, он тоже бесплатен! Во всяком случае, на момент написания данной статьи!

Онлайн-сервис dictation.io

Этот сервис для перевода аудио в текст не может подключать аудиофайлы или видеофайлы. Тут для транскрибации нужно проиграть аудиофайл на другом устройстве, и записать на микрофон в dictation.io.

Чем же хорош это сервис для перевода аудио в текст? Своей лаконичностью. Ничего лишнего! И, кстати, качество распознавания речи вполне себе на уровне! Удобно сохранять распознанный текст на компьютер. Сервис полностью бесплатный. Жалко только, что нельзя транскрибировать аудиофайлы

Сайт и программа RealSpeaker

Нужно знать, что сейчас оффлайн версии, то есть, программы для транскрибации ReaLSpeaker уже нет. Если Вы хотите пользоваться именно программой, то ищите старую версию.

Сейчас же можно работать только в режиме онлайн-сервиса.

Некоторым транскрибаторам эта программа (и сайт) очень нравится. Некоторым не очень. Я предлагаю Вам ответить на этот вопрос самостоятельно. Потестируйте немного ее, и узнаете.

В плюсы Реалспикера можно отнести то, что она работает с загруженными аудиофайлами. Есть много языков, которые RealSpeaker понимает. Из минусов – программа и сервис платные. Правда цена не очень высокая, но все-таки…

Программа Transcriber-pro

Еще одна офф-лайн профессиональная программа для расшифровки аудио и видео записей. С помощью Transcriber – pro Вы легко переведете аудио в текст!

Эта программа для транскрибации достаточно удобна. Есть горячие клавиши. Можно загружать аудио и видеофайлы и их заниматься переводом аудио в текст. Одна из “фишек” Транскрибера – Про – это командная работа над проектом. Единственное, эта программа не умеет распознавать речь. Это узкоспециализированный инструмент, предназначенный только для транскрибации!

Программа RSPlayer

Многие хвалят эту программу для профессиональной транскрибации.

Однако, сейчас официальный сайт этой программы не работает. Может в ближайшем будущем эта программа возродится вновь, но пока я сделать обзор на нее не могу. Если где-то найдете старую рабочую версию РСплеера, проверьте на вирусы. Рекомендую 🙂

Приложение Windows – VOCO

Эта программа распознавания речи профессионального уровня.

Основной функционал Windows-приложения перевода аудио в текст VOCO:

  • Голосовой набор текста с микрофона
  • Расстановка знаков препинания устными командами
  • Распознавание знаков препинания в аудиофайлах. Это круто!
  • Само-собой есть распознавание речи из аудиозаписей.
  • Есть сопряжение с Word
  • Можно подключать словари
  • Ну и есть свой, достаточно большой словарный запас

Короче, программа просто находка для профессионального транскрибатора! Но программа платная! Правда, есть демо-версия, в которой Вы можете ознакомиться с основным функционалом бесплатно. Правда, нужно подать заявку скачивание демо-версии Voco.

Программа Virtual Audio Cable

Для некоторых сервисов (например, для speechpad.ru) может понадобиться так называемый виртуальный кабель. Он нужен для того, чтобы напрямую передать аудиофайл в систему распознавания аудио, а не транслировать через микрофон. То есть, чтобы не терялось качество речи и все распознавалось как можно лучше.

Для настройки всего этого дела придется потанцевать с бубнами, то есть повозиться с настройками. Но, как я писал выше, некоторые программы без этой Virtual Audio Cable работать не будут.

К сожалению, проконсультировать по поводу настройки этих виртуальных кабелей я не смогу. У меня базовая система Линукс Минт. А эти программы предназначены для Windows. Впрочем, если будет интересно, скину ссылки на статьи других авторов, где все подробненько расписано.

Гугл Документы

На последнем месте в списке стоят гугл документы. Но не на последнем месте по значимости. В гугл документах тоже есть голосовой ввод!

Кстати, этот голосовой ввод работает на удивление очень хорошо. Вы даже можете голосом расставлять знаки препинания. К сожалению, сюда нельзя подключить аудиофайлы для прямой транскрибации. Только “динамик-к-микрофону”. Качество перевода аудио в текст при этом может пострадать. Зато Гугл Документы совершенно бесплатны!

А в этой статье я рассказываю, как заработать на транскрибации. Нажмите сюда для чтения статьи!

Итого:

Теперь Вы знаете, какие есть программы для транскрибатора, то есть для перевода аудио в текст. Возможно, есть еще что-то, что я не знаю. Тогда напишите мне о них и я расскажу об этом! И еще. Я не рассказывал про мобильные приложения для расшифровки аудиофайлов. Почему? Потому что, такие программы для смартфонов нужны в основном для записи своих мыслей простым людям, а также журналистам и писателям. профессиональные транскрибаторы мобильными программами практически не пользуются.

Посмотрите на видео ниже, как это выглядит “вживую”.

Ваш Nаставник онлайN

МЕНЮ RealLanguage.Club

Рады вам представить озвученные английские тексты с разными уровнями сложности. Выбирайте тексты, подходящие под ваш уровень знания английского. Если вам показалось лёгким прохождение текстов одного уровня — переходите на уровень выше по сложности, и наоборот.

Английские тексты начального уровня

Английские тексты среднего уровня

Английские тексты уровня выше среднего

Английские тексты продвинутого уровня

Английский язык с репетиторами онлайн

Теперь Вы можете обучаться английскому языку самостоятельно, пользуясь бесплатными ресурсами нашего образовательного сайта, а также выбрать себе подходящего репетитора у нашего партнера и заниматься в школе TutorOnline:

  • Индивидуальные занятия
  • Доступные цены
  • Удобные способы оплаты
  • Бесплатный вводный урок
  • Гарантированный возврат денег

Как выбрать репетитора по английскому языку

Бесплатный пробный урок

Практичные советы по изучению английского языка

Как научиться свободно говорить на английском

Как успешно пройти собеседование на английском

Гимнастика для лингвистов: комплекс для правильного произношения

5 правил успешного изучения языка

Как улучшить знание иностранного языка: три совета и пять правил

Все советы

Мы в соцсетях:

29.10.2019 12:38 8 Знания

image

Обновленная подборка сервисов, которые бесплатно расшифруют речь в текст — записи интервью, голосовые сообщения и озвучку видео. Будет полезно копирайтерам и журналистам.

Использовать голосовой набор не всегда удобно, если это не запросы в поисковики. В шумной обстановке не получается прослушать запись голосового сообщения, некоторые люди в принципе лишены такой возможности. Если надиктованная информация нужна в печатном виде, войсы приходится переслушивать и перепечатывать, это тратит время и силы. Расшифровать интервью и аудиодорожку к видео тоже хорошо бы не собственными руками. 

Зачем может понадобиться конвертировать аудио в текст

  1. Расшифровать запись длинного интервью или подкаста.
  2. Сделать транскрибацию озвучки видео.
  3. Понять, о чем говорят в голосовом сообщении, когда нет возможности послушать.
  4. Общаться с людьми с особенностями слуха.

Сервисы для перевода речи в текст

Блокнот для речевого ввода

Возможности: перевод диктуемых слов в текст, транскрибирование речи из аудио и видео с Ютуба.

image
Тест сервиса на знаки препинания

Транскрибирование текстов из загруженных аудиозаписей и из видео с Ютуба происходит в реальном времени при воспроизведении. Загружаем файл в сервис или указываем ID видео (символы после https://www.youtube.com/watch?v=), нажимаем «Включить запись».

image
Сервис транскрибирует речь ведущего

Сервис не идеальный, но работает бесплатно, прост в управлении и не требует регистрации. Результат расшифровки может быть довольно чистым — всё зависит от дикции и скорости речи. Лишний повод потренироваться, если диктуете для себя, но нужно привыкнуть называть знаки препинания, если не хочется расставлять их потом.

Расширение «Голосовой ввод текста» для Google Chrome

Возможности: диктовка текста в соцсетях, строке поиска и на сайтах. Диктовка в приложениях Windows,Linux и Mac.

Расширение для соцсетей и форумов

Расширение умеет переводить голос в текст: можно диктовать поисковые запросы, сообщения в социальных сетях и на форумах.

Попробуем надиктовать сообщение в ВКонтакте. Открываем диалог, кликаем правой кнопкой мыши и выбираем расширение.

image
Выбор расширения по клику правой кнопкой
image
Готовый текст сообщения

Сложно привыкнуть диктовать знаки препинания, на их озвучивание уходит много времени, но зато не нужно расставлять запятые вручную.

Результат расшифровки зависит от дикции говорящего, но в целом расширение для ввода хорошо справляется.

Расшифровка в любых приложениях Windows, Linux и Mac

Дополнительный бесплатный модуль для интеграции открывает тестовый период режима, который позволяет вводить текст напрямую в любые браузеры и приложения Windows: Word, Excel, Google Docs и другие — в любые места, где используется клавиатура. Для этого нужно зарегистрироваться в Голосовом блокноте и установить модуль.

После установки модуля нужно зайти в личный кабинет и включить тестовый период:

image
Личный кабинет в сервисе
image
Даты тестового периода

Попробуем надиктовать текст, например, в Word:

  1. Заходим на сайт голосового блокнота, включаем запись.
  2. Открываем документ в Word и начинаем диктовать.
  3. С задержкой в пару секунд текст появляется на экране.
image
Транскрибация речи в текст в Word
Диктовка письма в Gmail

Чистота расшифровки зависит от дикции, громкости и скорости речи, после диктовки скорее всего придется внести несколько правок в окончаниях и заглавных буквах.

Тестовый период длится всего три дня, его хватит, чтобы понять, нужен ли вам сервис. Плата небольшая: 100 рублей за месяц, 250 за три или 800 за год использования расширенных возможностей.

Dictation.io

Возможности: расшифровка живой речи, подкастов и озвучки видео в текст в реальном времени.

Сервис Dictation заявлен как мультиязычный, он может распознавать речь на более 100 языках. Он использует движок распознавания речи Google.

Регистрация не нужна, сервис работает бесплатно. Он похож на Голосовой блокнот: нужно кликнуть на включение распознавания, надиктовать что-то самому, включить подкаст или видео с речью, а сервис в реальном времени будет слушать и распознавать текст.

С живой диктовкой он справился довольно хорошо, распознал голосовое обозначение знаков препинания «точка», «запятая».

Расшифровка диктовки специально для сервиса

Расшифровка подкаста «Это реальная история — Дело об исчезновении Кристофа Сиона» получилась не очень чистой, хотя ведущая говорила внятно. Видимо, дело в скорости речи.

Расшифровка подкаста

С транскрибированием ролика «Regional German Dialects» на канале Easy German сервис справился отлично. Ведущая с хорошей дикцией говорила в обычном не быстром темпе.

Расшифровка речи из видео

В любом случае, если человек не диктует специально для сервиса, называя знаки препинания, придется править текст. Чистота расшифровки зависит от скорости аудиодорожки, с внятной медленной речью он справляется отлично.

Dragon Dictation

Возможности: расшифровка надиктованных предложений в текст.

Расшифровка речи

Программа работает бесплатно, но только на iOS.

Otter

Возможности: распознавание англоязычной речи в записи или на диктовке с возможностью идентифицировать собеседников.

Прочитайте это сообщение, чтобы бот вас запомнил
Сервис транскрибировал фразу на английском

Фразу «расшифруй что-нибудь на русском» он распознал так:

Фразы на других языках сервис не понимает

Можно загрузить аудио или видео с английской речью, сервис выведет текст. Некоторые спорные моменты из-за произношения могут расшифровываться неправильно.

Сервис не распознал слово penguins

Программа бесплатна, она будет полезна, если вы работаете с англоязычными источниками.

Бот в ВКонтакте

Бот «Что тут сказано?» расшифровывает голосовые сообщения. Войс нужно переслать в переписку с ботом, он пришлет текст в ответ. Если надиктовать аудио напрямую в диалог с ботом, он не справится.

Бот расшифровывает войсы
Приглашаем бота в беседу
Выбираем чат
Даем доступ к сообщениям

Теперь если кто-то из участников записывает войс, следующим сообщением бот пришлет расшифровку.

Протестировать другие боты для перевода голосовых сообщений в текст не удалось, группы заброшены, а боты не реагируют на команды.

Бот в Телеграме

Возможности: расшифровка записанных голосовых сообщений в текст.

Бот Voicy переводит аудиосообщения или аудиофайлы в текст. Можно писать или присылать аудиофайлы боту напрямую или добавить его в чат, тогда на каждую реплику он будет отвечать ее текстовой расшифровкой.

Бот присылает расшифровку сразу после сообщения

Бота нужно настроить. Команда /language вызывает выбор языка, на котором будут записываться голосовые, /engine дает выбрать движок:

  • стандартный wit.ai хорошо распознает слова, но не справляется с сообщениями длиннее 50 секунд;
  • Yandex.SpeechKit работает без ограничений, но распознает слова хуже;
  • Google Speech хорошо распознает голос, работает с любой длиной, но требует оплаты.

Команда /silent отключит уведомления о том, что бот приступил к работе над войсом.

Для отключения бота в чате нужно набрать команду /files.

Сервис Zapisano.org

Иногда нужна точная расшифровка аудиозаписи, но на внесение правок в распознанные тексты или самостоятельный набор с нуля нет времени. В этом случае пока единственный выход — делегировать ручную расшифровку кому-то другому.

За помощью можно обратиться к фрилансерам или в специализирующиеся на транскрибации фирмы. Однако в первом случае придется потратить дополнительное время на поиск ответственного исполнителя и согласование условий, а во втором — на общение с менеджерами по почте.

Для того, чтобы сэкономить время на всех этапах работы, можно воспользоваться сервисом Zapisano.org. Пока это единственный в России сервис расшифровки с личным кабинетом, куда можно быстро загрузить аудиофайлы, оплатить заказ, а после его выполнения хранить исходные аудио и стенограммы.

Загрузка аудиозаписей для расшифровки
Выбор формата тарифа для расшифровки
Личный кабинет с прогрессом по задачам

Интерфейс также оптимизирован под мобильные устройства, поэтому в кабинет удобно загружать записи, сделанные на телефон. 

Сервисы из подборки помогут сделать расшифровку интервью на аудио или видео, быстро узнать содержание голосового сообщения и упростят работу с надиктованным текстом. Качество расшифровки сильно зависит от дикции и скорости речи, поэтому всегда требует правок. Если нужно быстро получить точный текст без ошибок распознавания, единственный выход пока — делегировать ручной труд фрилансерам или специализированным сервисам.

Теги поста или какие разделы почитать еще:

Оцените статью
Рейтинг автора
5
Материал подготовил
Илья Коршунов
Наш эксперт
Написано статей
134
А как считаете Вы?
Напишите в комментариях, что вы думаете – согласны
ли со статьей или есть что добавить?
Добавить комментарий