Как включить и настроить голосовой ввод текста на телефонах Андроид и ПК

Голосовой блокнот позволяет вводить текст, используя микрофон, а также переводить речь из аудио и видео в печатный текст. В настоящее время голосовой ввод возможен только в браузере Chrome для OS Windows, Mac и Linux (для пользователей Андроид и iOS разработаны специальные Android, iOS приложения). Для работы сервиса рекомендуется использовать внешний микрофон неплохого качества.

Голосовой набор текста

Нажмите кнопку «включить запись». При первом посещении сайта вверху браузера возникнет панелька с просьбой разрешить доступ к микрофону. Нажмите там кнопку «Разрешить» Говорите в микрофон Кнопка A/a меняет регистр первой буквы слова, рядом с которым находится курсор Кнопка Отменить удаляет из результирующего поля последний введенный фрагмент Кнопки пунктуации служат для ввода знаков с помощью мыши Текст в результирующее поле добавляется после последней позиции курсора. Если был выделен фрагмент текста в результирующем поле, то введенный текст будет его заменять Установка флажка Отключить управление заглавными буквами Google отменяет простановку заглавных букв анализатором Google. Если отмечен флажок Заменять слова пунктуации, то слова в голосовом вводе, совпадающие со знаками препинания, будут заменяться на эти знаки. Соответствующие слова можно увидеть, если навести мышь на кнопку знака. *В настоящее время Google самостоятельно заменяет слова: точка, запятая, вопросительный и восклицательный знаки, поэтому при отключении флажка замена все равно может проводиться. Смена языка для голосового ввода осуществляется выбором соответствующего языка в выпадающем списке. Если языка нет в списке, но он поддерживается для голосового ввода, то его можно добавить в кабинете пользователя (доступен после регистрации) Если отмечен флажок Выполнять команды, то во время ввода текста можно давать команды голосом. Если отмечен флажок Вывод в буфер обмена, то текст будет поступать не в результирующее поле, а в буфер обмена. Флажок работает только при установленном расширении блокнота. Если отмечен флажок Возобновлять при ошибках, то запись не будет отключаться самостоятельно при ошибках и длительном молчании. —> Поле Уровень распознавания отображает качество распознавания речи или вид ошибки, если она возникла.

Ввод текста голосом любое поле ввода! Интеграция с Windows, Mac и Linux

Установив расширение для голосового блокнота, вы получите возможность вводить текст голосом в любое поле ввода напрямую. Добавив модуль интеграции c Windows, Mac или Linux, вы обеспечите прямой голосовой ввод во все приложения в этой OS.

Перевод аудио в текст

Кнопка Транскрибация включает панель воспроизведения звуковых и видео файлов. В настоящее время в голосовом блокноте доступен перевод аудиотекстов из форматов html5 видео и аудио, а также из видеозаписей youtube. Для форматов html5 видео и аудио необходимо указать URL медиа файла, для воспроизведения записи youtube нужно ввести ID этой записи в Youtube. После чего следует нажать на кнопку включить запись.

Снятие флажка Запускать синхронно с записью в модуле транскрибирования дает возможность самостоятельно проговаривать прослушиваемые фрагменты аудио или видео (при использовании наушников). Данная опция крайне полезна при плохом качестве роликов, когда автоматическое распознавание невозможно.

Видео инструкции по работе с системой

Обучающие видео по работе с голосовым блокнотом.

Приложения для голосового блокнота

Для удобства работы можно установить приложение CHROME или воспользоваться возможностями CHROME по созданию ярлыков приложений для запуска блокнота с предустановленными параметрами.

<label>Язык голосового ввода </label><label> Уровень звука</label>  Уровень распознавания <label> Отключить звуки</label><label>Длина буфера фраз  </label><label>Пауза в речи  </label><label>Интервал перезагрузки в символах ?</label> <label> Возобновлять при ошибках</label><label> Выполнять команды</label><label> Отключить управление заглавными буквами Google</label><label> Заменять слова пунктуации</label><label> Вывод в буфер обмена</label><label> Интеграция с OS (выкл)</label>?<label> Добавлять в конец текста</label><label> Простой режим Google</label>?<label> Пунктуация в Яндекс</label>

—>

Для многих из нас скорость работы имеет первоочередное значение. Особенно это важно в отношении набора текстов, которые требуется подготовить к определённому сроку. Если вы печатаете медленно, набор больших объёмов может превратиться в одно сплошное мучение, оканчивающееся изнурением, усталостью и головной болью. Действенной панацеей могут стать способы, позволяющие продиктовать предложения через online-сервисы и получить на выходе файл в формате doc или txt. Ниже мы приведём ТОП-4 способов, позволяющих выполнить набор текста голосом в сети. А также поясним, что нам для этого понадобится.

Содержание

Способ №1. Speechpad.ru — ввод текста речью онлайн

Ресурс speechpad.ru – один из наиболее популярных инструментов для превращения голоса в текстовый файл. Сервис позволяет надиктовывать предложения онлайн как напрямую, так и использовать возможности транскрибации. Последняя позволяет считывать речь из видео и аудио файлов. Сервис поддерживает работу с 11 языками (включая русский и английский), автоматическое управление заглавными буквами. Для работы с сервисом понадобится браузер Google Chrome.

Выполните следующее:

  1. Перейдите на speechpad.ru;
  2. Выберите язык голосового ввода, на котором вы будете надиктовывать текст;
  3. Нажмите на кнопку «Включить запись» (при необходимости предоставьте сервису доступ к микрофону, нажав на «Разрешить»);
  4. Надиктуйте свой текст;
  5. В конце нажмите на кнопку «Отключить запись»;
  6. Сохраните результат, нажав на «Скачать» ниже.

transcribation.jpg

Если вам понадобится провести транскрибацию нужного аудио или видеофайла, нажмите внизу на кнопку «+Транскрибацию», и загрузите нужный файл на ресурс для проведения процедуры.

Это интересно: Голосовой переводчик онлайн.

Способ №2. Speechtexter.com — сервис для голосовой диктовки

В наш топ способов для осуществления речевого ввода предложений online мы включили и сервис speechtexter.com. Последний поддерживает более чем 60 языков диктовки, точность его распознавания составляет более 90% (для English USA – более 95%), имеется возможность сохранения надиктованного результата в формате txt и doc. Благодаря гибкому функционалу сайта вы можете самостоятельно добавлять на него нужные команды для работы с пунктуацией.

Для работы с ресурсом выполните следующее:

  1. Откройте speechtexter.com;
  2. Нажмите на надпись «START DICTATING» в центре;
  3. На рабочей панели справа выберите язык диктовки (к примеру, «Русский»);
  4. Нажмите на надпись «Start» слева и начните вашу диктовку;
  5. Для окончания процесса чтения нажмите на «Stop»;
  6. Для сохранения результата нажмите на кнопку «Download» справа и выберите формат сохраняемого файла (txt или doc).speechtexter.com-nachitka.jpg

Способ №3. Convert.town — простой инструмент для конвертации речи в текст

Сервис convert.town относится к инструментам типа «Включил и работай». Как и другие сервисы данного плана, он работает на «Web Speech API» и требует для своей работы браузер Chrome. Сервис практически не имеет каких-либо настроек.

Для работы с ним достаточно перейти на convert.town, и сразу же начать диктовку голосом нужного вам текста. Полученный результат сразу будет отображаться в соответствующем окне внизу. Останется скопировать его и перенести в нужный вам редактор (например, МС Word).

Способ №4. Онлайн-расширения для браузера Chrome

Также следует упомянуть расширения «Голосовой ввод текста» и «Голосовой набор текста» для браузера Хром. После их установки в веб-навигатор вы можете в любой момент активировать их и надиктовать текст в нужном поле браузера, текстового редактора или другого инструмента вашей ОС.

Для работы с расширением вначале необходимо выбрать язык голосового ввода (обычно доступен в настройках расширения). Затем установите курсор в место, где должен быть ваш текст, нажмите ПКМ, после чего активируйте опцию запуска функционала расширения (например, «Speech pad»). Останется надиктовать нужные предложения и сохранить их (отправить получателю).

Для активации возможностей расширения нажмите ПКМ и выберите опцию запуска функционала расширения

Читайте также: Озвучка текста мужским голосом.

Заключение

В нашем материале мы разобрали ТОП-4 способов, позволяющих выполнить голосовой набор текста в режиме онлайн. Все перечисленные инструменты эффективно распознают человеческую речь, переводят её в предложения и могут существенно сократить затрачиваемое вами время на набор статей и докладов. Особенно рекомендуем сервисы speechpad.ru и speechtexter.com – они заслужили множество хвалебных отзывов от благодарных пользователей.

Если вы работаете в digital-маркетинге, вам постоянно нужно взаимодействовать с текстом: записывать идеи, задачи, описывать концепции, писать статьи и многое другое. Иногда проще и быстрее надиктовать текст, чтобы не забыть важную мысль или задачу. Диктофон для этого подходит плохо: запись потом нужно будет расшифровывать и переводить в текст. А если оставлять голосовые заметки часто, то потом просто нереально быстро найти нужную информацию или бегло ее просмотреть.

Голосовой ввод текста помогает решить эту проблему. Вы диктуете — программа сразу переводит речь в текст, который вы можете сохранить как обычную заметку и дальше работать с ней спокойно работать.

В статье мы собрали подборку бесплатных сервисов голосового ввода, которые помогут вам:

  • быстро и удобно делать заметки, когда нет возможности или времени записывать вручную;
  • записывать голосом список задач;
  • надиктовывать черновики статей и других текстов.

Берите на вооружение сервисы из подборки и тестируйте — все они бесплатные и неплохо распознают русский язык.

Содержание статьи5 бесплатных онлайн-сервисов для голосового ввода1. SpeechPad2. VoiceNote3. Voice Notepad4. Speechtexter.com5. TalkTyperДополнительные инструменты для голосового ввода текстаЯндекс.Клавиатура и GBoard (Google Клавиатура)Google DocsРекомендации, которые помогут улучшить качество распознавания текста

5 бесплатных онлайн-сервисов для голосового ввода

1. SpeechPad

https://speechpad.ru/

Speechpad — бесплатный сервис для голосового ввода текста. Доступен в трех форматах:

  • онлайн-сервис;
  • браузерное расширение — с его помощью можно вводить текст в любое поле для ввода;
  • мобильное приложение для Android и iOS.

У сервиса также есть платные функции. Их два вида:

  • дополнительные (расширенные). Включают в себя голосовой ввод в режиме интеграции с OS Linux и Windows, а также транскрибирование аудиофайлов длиной более 15 минут;
  • премиум. Пакетное транскрибирование аудио и видео (больше двух файлов).

Онлайн-сервис

Интерфейс сервиса выглядит так:

Здесь есть несколько настроек, кнопки управления и поле, в котором отображается распознаваемый текст.

Что можно сделать сделать:

  • настроить язык голосового ввода. Базово с списке доступно 14 языков (среди них русский, украинский, английский, немецкий). Если нужен другой язык, необходимо зарегистрироваться в сервисе. После этого в личном кабинете появится возможность добавить этот язык (если для него поддерживается распознавание речи);
  • активировать опцию «Включить команды». Если вы авторизованы в личном кабинете, вы можете добавлять голосовые команды и использовать их при надиктовке текста. Например, удалить последний распознанный фрагмент текста;
  • отключить управление заглавными буквами Google. По умолчанию в речи распознается начало предложений и автоматически проставляются заглавные буквы. Вы можете отключить эту опцию и самостоятельно редактировать предложения.

Обратите внимание! Онлайн-сервис Speechpad корректно работает только в браузере Google Chrome. Можно запускать его и в Яндекс.Браузере, но все же для корректной работы рекомендуется использовать именно Chrome.

Для начала распознавания текста нажмите кнопку «Включить запись» и предоставьте доступ к микрофону.

Затем надиктовывайте текст. Сначала распознанные слова появятся в поле справа от кнопки «Включить запись». После небольшой паузы они попадут в поле ниже (результирующее поле).

Над результирующем полем есть кнопки со знаками пунктуации. По ходу диктовки вы можете добавлять их вручную.

После того как вы закончили диктовку, просмотрите текст, исправьте ошибки (если есть). Затем скопируйте текст или скачайте в виде txt-файла.

Транскрибация

Также с помощью Speechpad можно переводить аудиозаписи разговоров в текст с помощью опции «Транскрибация».

Здесь можно будет загрузить аудио- или видеофайл, а также добавить ссылку на видео с Youtube.

После нажатия на кнопку «Включить запись» файл начнет проигрываться и система переведет речь в текст.

Расширение SpeechPad

Установите расширение из магазина расширений Google Chrome. После установки в контекстном меню в браузере (при клике правой кнопкой мыши на любой области экрана) появится пункт «SpeechPad».

Кликните правой кнопкой мыши по любому полю для ввода текста и выберите расширение из контекстного меню. Поле подсветится, и вы сможете голосом произнести фразу, которую нужно ввести в поле. Расширение распознает ее и отобразит в виде текста.

Мобильное приложение

Доступно две версии: для Android и iOS.

Приложение может работать в автономном режиме (без подключения к интернету). Так выглядит интерфейс приложения на Android:

В настройках можно управлять голосовыми командами (для расстановки знаков препинания и спецсимволов с помощью голоса):

2. VoiceNote

https://voicenote.in/

VoiceNote — еще один сервис для преобразования голоса в текст, который работает только в Google Chrome (также может работать в Яндекс.Браузере). При попытке запустить его в другом браузере появляется сообщение об ошибке.

Для голосового ввода через VoiceNote можно использовать Live Demo или отдельное приложение для Chrome.

Как пользоваться сервисом

Откройте редактор и выберите язык, на котором нужно распознавать речь. Для этого кликните по иконке земного шара и укажите нужный язык.

Затем кликните по значку микрофона и предоставьте сервису доступ к микрофону вашего компьютера или ноутбука.

После этого система начнет запись и вы сможете надиктовывать текст. Распознанный текст появится в редакторе. Возможности:

  • можно проговаривать знаки препинания словами;
  • голосовой командой можно перевести текст на новую строчку;
  • с помощью панели инструментов можно вручную добавлять знаки препинания и спецсимволы прямо во время диктовки;
  • готовый текст можно отредактировать и сохранить в txt-файле.

3. Voice Notepad

https://dictation.io/speech

Еще один сервис для голосового ввода текста. Как и остальные сервисы, работает только в браузере Google Chrome.

У сервиса простой интерфейс. Здесь есть:

  • возможность выбрать язык распознавания (сервис работает на основе движка Google Speech Recognition и может распознавать речь на более чем 100 языках);
  • текстовое поле — здесь будет появляться распознанный текст, который можно отформатировать: выделить полужирным, курсивом или подчеркиванием, оформить списки, добавить или убрать отступы, задать выравнивание;
  • кнопки управления — кнопка Start активирует распознавание речи. С помощью остальных кнопок можно копировать текст, сохранять в txt-файл, публиковать и совершать другие действия.

Сервис поддерживает голосовые команды. Например, с помощью команды можно перевести текст на новую строку, поставить тире или другие знаки препинания, спецсимволы и т. д.

Полный список поддерживаемых команд для русского языка — здесь.

4. Speechtexter.com

https://www.speechtexter.com/

Бесплатный онлайн-сервис для распознавания речи. Достаточно неплохо распознает русский язык. Всего поддерживает более 60 языков.

У SpeechTexter есть веб-версия (работает только в Google Chrome) и мобильное приложение для Android.

Для начала работы с сервисом необходимо выбрать язык распознавания и нажать кнопку Start (предоставив доступ к микрофону).

В текстовом поле есть несколько полезных функций:

  • счетчик слов, распознанных системой;
  • инструменты редактирования текста: выделение полужирным, курсивом, подчеркиванием, выравнивание текста, изменение размера шрифта. Также можно менять цвет текста, создавать нумерованные и ненумерованные списки;
  • можно включить ночной режим — полезно, если вы используете сервис вечером или ночью.

В правой части интерфейса размещен блок со стандартными голосовыми командами для добавления знаков препинания и нового абзаца:

На вкладке Custom можно создать свои команды, например для добавления кавычек.

После завершения диктовки текст можно отредактировать и сохранить в файле:

  • в txt-файле;
  • документом Microsoft Word.

5. TalkTyper

https://talktyper.com/ru/index.html

Простой онлайн-сервис для голосового ввода с поддержкой 37 языков.

В этом сервисе минимум функций, однако с распознаванием русского языка он справляется вполне неплохо. Для начала распознавания речи необходимо нажать на значок микрофона, разрешить его использование в браузере и начать диктовку текста.

Если сервис распознал фразу неправильно, нажмите на значок «Варианты»:

Если среди предложенных вариантов нет правильного, текст можно поправить вручную.

После завершения распознавания вы можете сохранить текст в txt-файле, скопировать, распечатать или отправить на почту.

Дополнительные инструменты для голосового ввода текста

Яндекс.Клавиатура и GBoard (Google Клавиатура)

Если вы большую часть времени работаете со смартфона и хотите использовать возможность голосового ввода текста, воспользуйтесь функционалом голосового ввода, который есть в клавиатурах от Google и Яндекс:

  • GBoard — клавиатура от Google. Для Android и iOS;
  • Яндекс.Клавиатура. Для Android и iOS.

Так вы сможете надиктовывать текст в любом приложении, которое вы обычно используете для организации личных и рабочих заметок, задач и подобного (Google Keep, Notion, Trello и т. д.).

Воспользоваться голосовым вводом просто:

  1. Откройте нужное приложение (например, Google Keep) и создайте заметку;
  2. Откройте клавиатуру и нажмите на значок микрофона (ниже пример, как это сделать в GBoard);
  3. Начните диктовать заметку. Система распознает речь и преобразует ее в текст.

Голосовой ввод на GBoard (клавиатуре от Google)

Google Docs

Тем, кто много работает с Google Документами, пригодится встроенная функция голосового ввода (поддерживает русский язык).

Если вы еще не знали о ней, вот как ее включить: «Инструменты» → «Голосовой ввод».

Слева появится всплывающее окошко с выпадающим списком для выбора языка речи и кнопкой с иконкой микрофона.

Выберите нужный язык, нажмите на кнопку и начните диктовать текст.

Рекомендации, которые помогут улучшить качество распознавания текста

Все сервисы, которые мы привели в подборке, достаточно хорошо распознают русский язык, однако иногда качество распознанного текста может быть посредственным. Чтобы такого не происходило, следуйте нескольким базовым рекомендациям.

  • Используйте хороший микрофон. Идеально, если у вас есть качественная гарнитура или внешний микрофон с шумоподавлением. Если же используете встроенный микрофон компьютера/ноутбука, убедитесь, что микрофон исправно работает, ничем не прикрыт, а вы находитесь достаточно близко, чтобы звук хорошо улавливался устройством.
  • Произносите слова четко и неторопливо. Хорошая дикция определенно будет плюсом. Чем четче вы произносите слова, тем выше вероятность, что сервис сможет корректно распознать речь (даже если качество микрофона оставляет желать лучшего). Также не стоит произносит фразы слишком быстро, в этом случае часть слов может быть не распознана и текст придется редактировать.
  • Позаботьтесь, чтобы вокруг вас не было посторонних звуков и шумов. Для качественного распознавания речи вокруг не должно быть музыки и других громких звуков.

Соблюдайте эти рекомендации и необходимость правок будет минимальной.

Развитие технологий распознавания голоса даёт пользователям новые возможности для взаимодействия с различными устройствами. Мы постепенно привыкаем к голосовым помощникам, но с помощью голоса можно не только узнавать погоду или включать музыку, но и набирать большие объёмы текста.Содержание

Интеграция с системой — платная услуга. Проверить её работу можно без покупки лицензии, но для постоянного использования требуется подписка: месяц — 100 рублей, 3 месяца — 250 рублей, 1 год — 800 рублей.

Voco

Voco — платное Windows-приложение для распознавания речи и преобразования её в текстовый формат. Оно даже поддерживает расстановку знаков препинания с помощью специальных команд.

Для проверки орфографии эта программа использует встроенные словари. Кроме того, вы можете научить её новым выражениям, открыв доступ к вашим письмам и документам.

Стоимость лицензии:

  • Basic — 1718 рублей. Бесплатные обновления в течение 1 года. Продление подписки на апдейты — 559 рублей ежегодно.
  • Professional — 14 136 рублей. Продление подписки на обновления — 4937 рублей ежегодно.
  • Enterprise — от 50 749 рублей. Продление подписки на обновления — 17 786 рублей ежегодно.

Для домашнего использования оптимально подходит Voco.Basic. Однако в ней нет распознавания аудиозаписей и тематических словарей. Эти возможности доступны только в старших версиях.

Веб-сервисы и приложения для голосового ввода

Для использования голосового ввода от случая к случаю можно обойтись без  установки на компьютер специальных программ. Скорее всего, вам будет достаточно возможностей веб-сервисов и расширений для браузера.

Google Docs

Простой инструмент голосового ввода есть в Google Docs — сервисе для работы с текстовыми документами. Для его использования достаточно иметь аккаунт почты Gmail.

Как пользоваться голосовым вводом в Google Docs:

  1. Откройте сайт поисковой системы Google.
  2. Авторизуйтесь под своей учётной записью Google или зарегистрируйте новый профиль.
  3. Кликните по квадрату из точек, чтобы раскрыть меню с сервисами.
  4. Нажмите «Ещё», чтобы увидеть полный список.
  5. Перейдите в «Документы».
  6. В поле «Создать документ» нажмите «Пустой файл».

На экране появится текстовый редактор Google. Чтобы включить голосовой ввод, раскройте меню «Инструменты» и выберите соответствующую опцию. Слева появится виджет с микрофоном. Выберите в нём язык, на котором вы будете говорить, а затем нажмите на иконку микрофона, чтобы включить распознавание. Значок должен стать красным. Если браузер запросит разрешение на использование микрофона, дайте его.

Запуск голосового ввода доступен также с помощью сочетания клавиш Ctrl+Shift+S. Функция запускается с языком, установленным по умолчанию.

После настройки начинайте говорить — Google Docs будет распознавать речь и превращать её в текст. Знаки препинания и новую строку проговаривайте словами, чётко произносите окончания слов — в противном случае исправлять текст придётся очень долго.

Speechpad

Speechpad — бесплатный сервис, который работает только в браузере Chrome. Выше мы рассказали, как настроить его интеграцию с Windows. Однако для набора небольшого фрагмента текста в этом нет необходимости — с задачей отлично справится веб-интерфейс голосового блокнота.

  1. Откройте сайт Speechpad.ru.
  2. Пролистните главную страницу до окна редактора.
  3. Выберите язык ввода.
  4. Нажмите на кнопку «Включить запись» и разрешите использование микрофона.
  5. Диктуйте текст.

Возле кнопки «Включить запись» вы увидите поле предварительного показа. В нём отображается то, что будет добавлено в документ.

Расставлять знаки препинания и переходить на новую строку можно голосом или кнопками, которые находятся между полем предварительного просмотра и редактором. При наведении на каждую кнопку появляется текст голосовой команды, к которой она применяется — например, «вопросительный знак» или «открыть скобку».

Итоговый документ доступен для скачивания в формате TXT.

VoiceNote

VoiceNote — ещё один сервис для преобразования голоса в текст, который работает только в Google Chrome. При попытке запустить его в другом браузере появляется сообщение об ошибке.

Для голосового ввода через VoiceNote можно использовать Live Demo или отдельное приложение для Chrome.

Как пользоваться VoiceNote:

  1. Откройте редактор.
  2. Нажмите на значок в виде земного шара и выберите язык ввода.
  3. Кликните по иконке микрофона.
  4. Разрешите использование записывающего устройства.
  5. Диктуйте текст.

Правила ввода здесь стандартные: знаки препинания можно проговаривать словами, а также голосом отправлять текст на новую строчку.

Полученный документ доступен для сохранения в формате TXT.

TalkTyper

TalkTyper — онлайн-редактор для голосового ввода. Главное его достоинство — поддержка 37 языков. Однако TalkTyper, как и предыдущие сервисы, работает только в Google Chrome.

Принцип ввода текста в этом редакторе не отличается от других: вы указываете язык, нажимаете на значок микрофона и разрешаете его использование. Знаки препинания и новая строка проговариваются словами.

Результат обработки текста в TalkTyper можно сохранить в виде документа в формате TXT, скопировать в буфер обмена, распечатать, отправить по почте, твитнуть и перевести на другой язык.

Voice Notepad

Voice Notepad — ещё один сервис для преобразования голоса в текст, работающий только в Chrome. Он поддерживает больше 120 языков ввода. В остальном функциональность у него такая же, как у сервисов, перечисленных выше: расстановка знаков препинания голосом, сохранение документа в формате TXT, копирование в буфер обмена, отправка по почте или на печать и т.д.

Особенность онлайн-сервисов заключается в том, что все они работают только в Google Chrome. Это связано с тем, что в их основе лежит лицензионная гугловская технология распознавания речи. Другие браузеры её не поддерживают или поддерживают с ограничениями. Например, Speechpad можно запускать в Яндекс.Браузере, однако в чужеродной среде он часто работает с ошибками. Так что если вы не пользуетесь Google Chrome, проще всего установить одну из программ для голосового ввода на компьютер и забыть про неудобства.

speech-to-text-online.png

Содержание

Распознавание речи онлайн

Чтобы преобразовать речь в текст, можно воспользоваться соответствующим онлайн-сервисом в браузере. Сайты по распознаванию речи, как правило, не требуют регистрации и оплаты, они очень удобны в использовании. В первую очередь, потребуется установить браузер Google Chrome. Это связано с тем, что все сервисы работают на одном и том же движке распознавания речи от Гугл. Качество распознавания зависит от микрофона, а также ритма и четкости речи.

Читайте также: Включение микрофона на Windows 8

Способ 1: Speechnotes

Спичноутс — самый популярный сервис по распознаванию речи онлайн, предоставляющий большой выбор языков, расширенные возможности постановки знаков препинания и отправки надиктованного текста в сторонние приложения.

Онлайн-сервис Speechnotes

Перейдите по ссылке, в открывшемся окне появится интерфейс сервиса Спичноутс.

Порядок действий:

    1. Нажмите на иконку микрофона справа.
    2. Выберите «Разрешить» во всплывающем окне браузера. Слева над иконкой микрофона появится мигающий красный кружок — это означает, что запись включена.

Vklyuchenie-mikrofona-v-Speechnotes.png

    1. Выберите русский язык из выпадающего меню.

Vyibor-yazyika-Speechnotes.png

    1. Начните диктовать.
    2. Чтобы остановить запись, снова нажмите на иконку микрофона.
    3. Скопируйте текст в буфер обмена (А) или отправьте в сторонние сервисы, используя панель инструментов слева (B).

Kopirovanie-i-panel-instrumentov-v-Speechnotes.png

Для расстановки знаков препинания есть три способа:

    1. Диктовка: справа есть перечень знаков с соответствующим произношением;

Znaki-prepinaniya-v-Speechnotes.png

    1. Набор на клавиатуре — самый быстрый способ, так как добавляет знак еще до того, как заканчивается речь. Здесь главное дождаться, пока надиктованная речь появится в буфере (см. скриншот) и только после этого нажимать кнопку, иначе знак препинания появится перед надиктованной речью, а не после;

Rech-v-bufere-Speechnotes.png

  1. Кнопка на сайте — достаточно нажать соответствующий знак препинания в панели справа (см. пункт 1).

Результаты распознавания во многом будут зависеть от качества микрофона и диктовки. Для наилучшего результата говорить нужно медленно и четко. Это относится ко всем сервисам по распознаванию речи.

Способ 2: Speechlogger

Спичлоггер — многофункциональный сервис по распознаванию речи, с помощью которого можно не только диктовать тексты, но и переводить их на другие языки в режиме реального времени с Google Translate, а также транскрибировать аудиофайлы.

Онлайн-сервис Speechlogger

Чтобы начать запись на сайте Speechlogger, выполните следующие действия:

    1. Зайдите на сайт, прокрутите немного вниз до блока с голубым фоном и нажмите на иконку микрофона.
    2. Выберите «Разрешить».
    3. Найдите в списке русский язык, если это необходимо.
    4. Нажмите на кнопку справа вверху, чтобы блок распознавания речи занимал весь экран (это не обязательно, но так удобнее работать).

Nachalo-rabotyi-v-Speechlogger.png

    1. Начинайте диктовать.
    2. Текст, в котором может быть ошибка, выделяется красным цветом. Это позволяет быстрее находить неточности и исправлять их.

Krasnyiy-tekst-v-Speechlogger.png

    1. После того, как работа закончена, снова нажмите на иконку микрофона.
    2. Выделите весь текст с помощью кнопки All (A) и скопируйте, нажав правой кнопкой мыши и выбрав «Копировать» (сочетание клавиш Ctrl+C не работает), либо воспользуйтесь панелью инструментов (B), чтобы отправить текст по электронной почте, сохранить в формате .txt, .doc, загрузить на Google Drive или распечатать.

Способы постановки знаков препинания:

    1. Диктовка: чтобы узнать, как произносить тот или иной знак препинания, наведите на него курсор — во всплывающем окне появится подсказка.
    2. Просто нажмите на знак препинания в панели, расположенной над областью для текста.
    1. Автопунктуация: на сайте можно задать настройки для автоматической постановки знаков препинания. Не очень удобный вариант, так как при каждой паузе система ставит точку, при этом русский язык слишком гибкий и многообразный — задать четкие условия для постановки определенных знаков препинания невозможно. Поэтому рекомендуется отключить эту функцию, убрав соответствующую галочку.

Дополнительные настройки расположены в верхнем левом углу.

С их помощью можно включить или отключить следующие функции:

    • Автосохранение текста: если функция включена, доступ ко всем сессиям можно получить, нажав на иконку папки в панели инструментов;
  • Выделение слов красным шрифтом;
  • Отметки времени в тексте (включены по умолчанию).

Кроме того, можно задать настройки для автопунктуации и изменить цвет фона.

Способ 3: Online Dictation

Online Dictation — удобный сервис с лаконичным интерфейсом. Основное преимущество — простота в использовании.

Онлайн-сервис Dictation

    1. Сервис автоматически определяет язык по умолчанию, настроенный в браузере. Если язык не установлен либо используется гостевая учетная запись Chrome, необходимо установить русский: выпадающий список языков расположен внизу под областью для текста.
    1. Нажмите кнопку «Start Dictation».
    1. Разрешите использование микрофона на сайте.
    1. Начинайте диктовать. Для постановки знаков препинания используйте голосовые команды: «точка», «запятая», «вопросительный знак», «восклицательный знак», остальные знаки ставятся при помощи клавиатуры. Для начала нового абзаца действует голосовая команда «новый параграф», для перехода на новую строку — «новая строка».
    2. Закончив диктовать, нажмите «Stop Listening».
  1. После того как текст готов, его можно:
    • Скопировать, нажав кнопку «Copy» (1);
    • Сохранить в формате .txt, нажав кнопку «Save» (2);
    • Стереть, нажав кнопку «Clear» (3).

Способ 4: SpeechTexter

Сервис по распознаванию речи СпичТекстер отличается красивым компактным дизайном и позволяет редактировать текст прямо на сайте. Форматирование сохраняется при переносе текста в сторонний редактор.

Онлайн-сервис SpeechTexter

    1. Зайдите на сайт, выберите русский язык (1) и нажмите «Start Dictating» (2).
    1. Нажмите «Разрешить» во всплывающем окне.
    1. Начинайте диктовать. Для пунктуации используйте голосовые команды, указанные справа от блока с текстом. Функцию голосовой пунктуации можно отключить, нажав на «Voice Punctuation is ON», и затем расставлять знаки препинания вручную.
    1. Для прекращения записи нажмите «Stop».
    1. После того, как текст записан, его можно отформатировать, используя инструменты на панели, расположенной над текстом.
    1. Готовый текст можно скопировать (1), сохранить в формате .txt (2) или распечатать (3).

Инструмент распознавания голоса можно установить на собственный сайт. При этом посетители вашего ресурса смогут не только пользоваться голосовым поиском, но и заполнять формы без участия клавиатуры.

Код для вставки на сайт.

Совет: можно изменить свойство recognition.lang и подставить ‘ru-RU’ вместо ‘en-US’, тогда по умолчанию устанавливается русский язык.

У каждого из сервисов есть свои преимущества и недостатки. Рекомендуется попробовать поработать на каждом из них и выбрать наиболее подходящий, исходя из своих целей и предпочтений.

Используемые источники:

  • https://speechpad.ru/
  • https://sdelaicomp.ru/obzori/golosovoj-vvod-teksta-onlajn.html
  • https://habr.com/ru/company/click/blog/534710/
  • https://compconfig.ru/tips/nabiraem-tekst-golosom-programmy-i-servisy.html
  • https://public-pc.com/speech-to-text-online/

Оцените статью
Рейтинг автора
5
Материал подготовил
Илья Коршунов
Наш эксперт
Написано статей
134
Добавить комментарий