7 способов перевода аудио и видео в текст
Содержание:
- Dragon Dictate
- Особенности перевода голоса в текстовый формат
- Лучшие сайты для заработка на переводе аудио в текст
- Программа Express Scribe (Экспресс Скрайб)
- «Dragon Professional» — расшифровка аудиозаписей в текст
- Транскрибация вручную
- Сайты и биржи для работы
- Способы ускорить работу над расшифровкой
- Настраиваем доступ
- Для чего нужно переводить аудио в текст
- Программы, которые помогут увеличить заработок транскрибатора
- Звуковые переводчики онлайн
- Топ-5: Аудио переводчики с английского на русский
- Программы для транскрибации
- Какой может быть заработок на транскрибации?
- Как увеличить доход от расшифровки аудио
- ПОДВЕДЕНИЕ ИТОГОВ
Dragon Dictate
Увеличить
Эта программа от американских разработчиков применяется для распознавания английской речи и дальнейшего перевода ее в текст. Также с ее помощью можно управлять компьютером с помощью голосовых команд.
Именно на основе данной программы были созданы такие популярные русскоязычные версии, как «Диктограф», «Диктант», «Горыныч» и «Комбат». Отечественные программы не могут похвастаться точной работой – для корректной работы необходимо провести предварительные настройки, чтобы софт мог правильно распознавать тембр голоса. Незнакомые слова, англицизмы и неологизмы необходимо будет вручную занести в словарь.
Для одноразовой транскрибации рекомендовать такие программы не стоит, а вот те, кто занимается такой деятельностью регулярно, могут потратить время на тонкую настройку, чтобы упростить этот процесс. Но необходимо учитывать, что даже тщательно настроенные, эти программы не можно назвать полноценным софтом для транскрибации – они выдают слишком много ошибок.
Особенности перевода голоса в текстовый формат
Как известно, попытки создать программы для распознавания голоса берут своё начало ещё в середине 20 века. Поначалу распознавание было довольно слабым, но использование более совершенных методов и технологий (скрытые марковские модели, нейронные сети etc.) подняло распознавание голоса на довольно высокий уровень.
Ныне мы можем встретить достаточное количество сетевых сервисов и программ, выполняющих перевод речи в текст. Практически все они хорошо распознают человеческий голос на многих языках (включая русский), и способны переводить его в текстовый формат. При этом 100% понимания речи достичь пока не удаётся, Это связано с шумами при звучании, невнятной дикцией или акцентом говорящего, помехами в работе микрофона, эмоциональным состоянием человека и другими схожими факторами.
При этом использование таких сервисов и программ позволяет существенно сэкономить время при наборе различных текстов. Вы можете быстро надиктовать нужный фрагмент после чего сохранить его в удобном текстовом формате на ваш компьютер или телефон.
Давайте разберёмся, какие сервисы и программы помогут быстро перевести речь в текст.
Лучшие сайты для заработка на переводе аудио в текст
Работать можно на самых разных сайтах. К наиболее эффективным вариантам стоит отнести биржи фриланса. Они предлагают немало заказов в этом направлении.
Leelo
Это магазин фриланса. Зарегистрируйтесь и создайте новую продажу в разделе расшифровка аудио и видеозаписей. После модерации заказчики увидят ваше объявление и будут заказывать.
На этом портале представлено очень много различных заданий. Иногда можно встретить и заказы по транскрибации.
Fl.ru
Это наиболее крупная биржа фриланса на постсоветском пространстве. На ней можно встретить разнообразные заказы. К ним относятся и услуги по переводу записей в аудио-формат.
Freelance.ru
Это еще одна биржа фриланса, которая дает много работы.
Этот сайт для фрилансеров пользуется большой популярностью. Для работы требуется зарегистрироваться.
Зарабатывать на транскрибации можно с помощью бирж фриланса
Программа Express Scribe (Экспресс Скрайб)
Это наверное, одна из самых популярных программ для транскрибации
Программа на английском языку, но она интуитивно понятна. Кроме того, есть масса инструкций на Ютубе, как работать в ней.
В этой программе можно переводить аудиофайлы в текст. Эта программа позволяет удобно корректировать текст, изменять скорость прокрутки аудио. Можно поставить медленную скорость для того, чтобы писать под диктовку. Есть горячие клавиши для ускорения, пауз, перемотки и т.п. Можно делать метки тайм-кодов.
Express Scribe поддерживает все известные мне (и не известные ) аудиофайлы… Без проблем интегрируется с Вордом. Короче, работать с программой очень приятно и удобно.
Но… она ограниченно бесплатная. То есть, некоторое время ей можно пользоваться, а потом она перестает работать. Нужно покупать. Или удалять и ставить заново. Если Вы собираетесь профессионально зарабатывать, то можно и потратиться на пробретение Экспресс Скрайб.
«Dragon Professional» — расшифровка аудиозаписей в текст
На момент написания данного материала цифровой англоязычный продукт Dragon Professional Individual» является одним из мировых лидеров по качеству распознаваемых текстов. Программа понимает семь языков (с русским пока работает лишь мобильное приложение «Dragon Anywhere» на Android и iOS), обладает высоким качеством распознавания голоса, умеет выполнять ряд голосовых команд. При этом данный продукт имеет исключительно платный характер (цена за основную программу составляет 300 долларов США, а за «домашнюю» версия продукта «Dragon Home» покупателю придётся выложить 75 американских долларов).
Для своей работы данный продукт от «Nuance Communications» требует создания своего профиля, который призван адаптировать возможности программы под специфику вашего голоса. Кроме непосредственной диктовки текста, вы можете обучить программу выполнять ряд команд, тем самым делая своё взаимодействие с компьютером ещё более конгруэнтным и удобным.
Транскрибация вручную
Если Вы хотите экстрима, то попробуйте перевести речь в текст вручную. Даже если Вы планируете в дальнейшем для транскрибации активно использовать программы или сайты, о которых я расскажу ниже, все равно попробуйте это поделать “ручками”. Точнее “ушками”.
Сложность заключается в том, что сразу запомнить большой объем информации очень сложно. Вы играли когда-либо в “глухие телефончики”? Вот такой же итог часто получается в случае “ручной транскрибации”, когда “переводчик” пытается запомнить сразу много информации.
Так зачем же я Вам советую попробовать ручную расшифровку аудио в текст? Дело в том, что какие-бы ни были классные программы для транскрибирования, о которых я буду рассказывать дальше, иногда они не могут помочь. Например:
- В комнате шумно
- Диктор говорит тихо
- Диктор говорит с сильным акцентов
- У диктора “фефекты фикции”
- Записан на плохой микрофон
- Одновременно говорит много людей
- Диктор “вклинивает” иностранные фразы. Или малоупотребительные
Короче, “кочек”, на которых может застопориться Ваша программа масса. И в этом случае нужно подключать транскрибацию “вручную”.
Сайты и биржи для работы
Теперь пару слов о том, как стать транскрибатором. Для начала нужно найти свой первый заказ.
Сайты поиска работы
Вакансии транскрибатор или расшифровщик аудио в текст встречается на популярных площадках по поиcку работы. Обычно предложение можно найти в специальном разделе – фриланс, работа удаленно или работа на дому. Транскрибатор на оклад требуется реже, но такие предложения тоже есть.
В большинстве же случаев заказчики ищут исполнителей на биржах фриланса. Высокая конкуренция среди желающих заработать провоцирует демпинг, и заказчик всегда может нанять более дешевого исполнителя. Многих заказчиков интересует разовая сделка, и лишь немногие готовы на долгосрочное сотрудничество при достойной оплате.
Да, первые заказы принесут больше опыта, чем денег. Зато через некоторое время вы сможете повысить свой уровень и брать заказы дороже. А пока можете поискать заказы тут:
Сайты и биржи фриланса
- work-zilla.com; (Выбор редакции!)
- weblancer.net;
- free-lance.ru;
- kwork.ru; (Выбор редакции!)
- youdo.com;
- advego.ru;
- mylance.ru;
- fl.ru;
- moguza.ru.
Заказ “Транскрибация” на бирже Work-zilla
Сайты для авторов студенческих работ тоже иногда размещают заказы на транскрибацию. В основном, это лекции, записи семинаров, научных конференций и др.
Агентства по транскрибации работают онлайн и предлагают услуги транскрибации различной сложности. Им может быть интересно привлечение исполнителей, поэтому можно поискать работу у них.
Способы ускорить работу над расшифровкой
Имея огромный опыт в наборе текстов, для себя сделал следующие выводы как можно ускорить расшифровку аудио в текст.
При уменьшении скорости воспроизведения ролика, транскрибация производится с наименьшими ошибками.
Набирая текст вручную, идеально подходит схема: прослушал → запомнил → записал. Эта схема позволит не откладывать редактирование на потом, а сделать все сразу.
Использование команд, помогающих добавлять часть текста
Представим себе, что в тексте, часто попадается слово «Транскрибация», добавляем его в команду и при помощи горящих клавиш выводим в нужных местах.
Не важно набираете в ручную или при помощи онлайн программ, все правки и корректировки делам в самом конце.
Настраиваем доступ
Есть два способа работать с сервисом SpeechKit: через IAM-токен, который нужно запрашивать заново каждые 12 часов, или через API-ключ, который постоянный и менять его не нужно. Мы будем работать через ключ, потому что так удобнее.
Чтобы его получить, нам нужен сервисный аккаунт в «Облаке». Создадим его так.
1. Заходим в консоль управления и нажимаем на единственную папку в нашем облаке:
2. Выбираем «Сервисные аккаунты» → «Создать»:
3. Вводим имя (какое понравится), затем нажимаем «Добавить роль» и выбираем «editor»:
4. Заходим в сервисный аккаунт, который только что создали:
5. Нажимаем на кнопку «Создать новый ключ» и выбираем пункт «Создать API-ключ»:
Сервис спросит про описание — можно ничего не заполнять.
6. Сохраняем отдельно секретный ключ — он выдаётся только один раз и восстановить его нельзя. Выделяем, копируем и сохраняем в безопасное место:
Для чего нужно переводить аудио в текст
Для начала поговорим, для чего вообще может понадобиться транскрибация. Тут на самом деле очень много вариантов.
- Достаточно часто требуется расшифровка аудио какого-нибудь семинара очередного “гуру”. Он вещает час-два и его записывают на видео. А потом нужно все это дело издать в виде методички или книги. Это транскрибация так называемого вебинара. Кстати, вебинары расшифровывать немного легче, так как в случае невнятного звука можно иногда догадаться о чем речь по жестам и поведению спикера.
- Иногда обращаются журналисты. Они могут надиктовывать себе заметки на диктофон в течение выполнения какого-нибудь журналисткого расследования. И потом все аудио это нужно перевести в текст.
- Достаточно редкие “клиенты” транскрибатора это “настоящие писатели”. Они тоже сейчас часто любят надиктовывать книги в аудиофайл, а потом переносить на бумагу.
- Часто нужно транскрибировать аудиоподкасты. Кстати, что такое аудиоподкаст? Если по русски- это устное сообщение владельца сайта или блога своим подписчикам.
- Расшифровка аудио в текст разного рода интервью. Тут Вы понимаете, что нужно журналистам и всякого рода блоггерам.
- Иногда нужна расшифровка телефонных переговоров. Чаще всего такие работы заказывают фирмы для фиксации внутрикорпоративных переговоров.
- Еще бывает транскрибация совещаний. Но эту работу часто выполняют сами секретари и не отдают на аутсорсинг. Кстати, если Вы секретарь, то возьмите мои советы себе на вооружение.
Я перечислил только малую часть тех задач по транскрибации, для решения которых может понадобиться профессиональный транскрибатор. Этих задач может быть намного больше. Так что работа для “аудиопереводчика” всегда найдется.
Программы, которые помогут увеличить заработок транскрибатора
Облегчают и ускоряют транскрибацию текста специальные программы в помощь транскрибатору. Рассмотрим основные.
Express Scribe
Основные полезные функции — возможность уменьшать скорость воспроизведения текста и отматывать запись с помощью залипаюших клавиш. Последняя позволяет тратить меньше времени, чем при кликании мышкой в плеере.
Transcriber-pro
Набор полезных функций:
- горячие клавиши управления плеером;
- возможность вставлять в траскрибируемый текст имена собеседников и именные метки;
- функция автотекста;
- набор специальных меток, которые позволяют делать корректуру текста, не прослушивая запись повторно.
Минус — программа платная. Впрочем, годовая лицензия в 2019 году стоит 640 рублей.
LossPlay
- Плеер, который команда разработчиков создала специально для транскрибации текста.
- Максимально адаптирован к работе с MsWord. Система горячих клавиш позволяет работать, не переключаясь между окнами, а в настойках ввода можно предусмотреть основные вордовские шрифты.
- Можно вставлять тайм-коды и совмещать вставку их и текста одним нажатием клавиши.
- Занимает немного места на жёстком диске компьютера.
Если возникнут сложности в работе, можно посмотреть бесплатный курс видеоуроков.
VOCO
Программа для автоматического распознавания речи и преобразования в печатный текст. В версиях Voco.Professional и Voco.Enterprise предусмотрена возможность работы с аудиофайлами.
Как заверяет производитель, словарный запас программы — 85 тысяч слов, предусмотрена возможность его расширения. Для этого надо указать документы, которые послужат источником недостающей лексики. Другие особенности:
- При распознавании аудиофайлов автоматически расставляет знаки препинания.
- Программа платная.
- Производитель заверяет, что с помощью программы аудио трансформируется в текст в 1,5–2 раза быстрее, чем при расшифровке записи вручную.
Но полагаться на умную программу целиком не стоит. По завершении работы сверка с записью и корректура обязательны, а это всё равно время.
RealSpeker
Ещё одна программа — распознаватель текста, способная работать с любым онлайн или оффлайн текстовым редактором.
Среди полезных функций:
- начало и завершение распознавания по команде голосом;
- голосовые команды редактирования текста и знаков препинания;
- возможность фильтрации неверных результатов;
- автоматический переключатель заглавных букв.
Но, как и за любым распознавателем, нужен глаз да глаз, что и не позволяет откзаться от участия человека в транскрибации.
Звуковые переводчики онлайн
Готовы учиться переводить иностранные аудиозаписи? Тогда, приступим.
Топ-5: Аудио переводчики с английского на русский
- Использование Гугл Переводчика или Яндекс Переводчика. Этот способ хорош тем, что вы одновременно можете получить, как английский текст, так и его перевод. Настройте переводчик – над левым окном установите исходный язык аудио (английский), а над правым – язык, на который необходимо перевести (русский). Под левым окном переводчика нажмите на микрофон, разрешите использование микрофона, поднесите микрофон к колонкам, включите аудио и наслаждайтесь Подобным образом вы можете работать и с переводчиком от Яндекса:
- Еще один очень удобный сервис для распознавания речи и мгновенного перевода — speechlogger.appspot.com. Выставьте настройки – исходный язык, авто пунктуация, язык, далее также нужно поднести микрофон к колонкам, включить аудио и нажать на иконку “Микрофона”.
- С использованием speechpad.ru По работе с этим сервисом много инструкций в интернете. Особенно часто его используют для перевода речи в текст. Мы же будем использовать его для автоперевода. Перейдите на сервис speechpad, нажмите на кнопку +перевод, как показано на скриншоте ниже: Теперь выставьте настройки, как у меня на скриншоте: 1. Включите микрофон, 2. разрешите использование микрофона на сайте spechpad, 3. поднесите микрофон к колонкам, 4. Включите аудио (или видео) с иностранной речью.
- Второй вариант перевода английского аудио в текст – онлайн сервис dictation.io. Поднесите микрофон к колонкам, включите аудиозапись на английском языке и нажмите на сервисе кнопку “Start dictation”. После завершения записи нажмите “stop dictation”. Сохранить текст можно, нажав на кнопку “save”. Запись сохраниться в текстовом файле txt.
- Больше всего мне нравится третий вариант преобразования английской речи в текст. Перейти на сервис онлайн speech-to-text-demo. Он хорош тем, что не обязательно нужно проигрывать аудиофайл, хотя такая функция в сервисе тоже имеется. Благодаря этому, вы можете переводить аудио в текст в абсолютной тишине, если это требуется, например, если вы привыкли работать по ночам. Вторым вариантом является простая загрузка аудиофайла на сервис, где он автоматически распознается и будет переведен в текстовый файл. Однако не любой аудиофайл можно загрузить на сервис. Поддерживаются только расширения .wav, .flac, или .opus. Файл mp3 загрузить не получится, но и здесь есть выход – вам нужно всего лишь воспользоваться любым аудио конвертером, можно тоже онлайн. Рекомендую для конвертации аудио в другой формат сервис — online-audio-converter.com.Итак, теперь рассмотрим поэтапно процесс преобразования английской речи в текст при помощи указанного сервиса. Предположим, что у вас файл mp3. Значит, вам сначала нужно сконвертировать файл при помощи сервиса online-audio-converter.com. Вам нужно открыть аудиофайл, выбрать расширение, в которое необходимо сконвертировать (wav) и нажать кнопку “Конвертировать”. после завершения конвертации скачайте файл: Второй шаг – собственно перевод английского аудио в текст на сервисе speech-to-text-demo. Перейдите на этот сервис, нажмите на кнопку “Upload audio file” (загрузить аудио файл) и выберите из папки вашего компьютера сконвертированный в wav, flac или opus аудио файл. Через некоторое время в окне появится текст аудио. Пример:
Программы для транскрибации
Существует много специальных сервисов, которые позволяют облегчить работу. Сервис dictation.io считается прекрасным вариантом, который дает возможность бесплатно перевести речь в текстовый формат.
Площадка обеспечивает автоматическое сохранение готовых результатов. Это поможет избежать случайного удаления вследствие закрытия вкладки или браузера. Сервис не позволяет распознать готовые файлы. Он работает с микрофоном. При диктовке следует называть знаки препинания.
Текст удается распознать достаточно корректно, без орфографических ошибок. Также можно самостоятельно вставлять с клавиатуры знаки препинания. Сохранить готовые результаты можно на своем компьютере.
Сайт speechpad.ru представляет собой онлайн-площадку, которая позволяет через браузер Google Chrome переводить речь в текстовый формат.
Сервис работает с готовыми файлами и микрофоном. Безусловно, качество будет выше при использовании внешнего микрофона. Однако сайт неплохо трансформирует даже ролики на YouTube.
При этом нужно нажать «Включить запись», ответить на вопрос относительно использования микрофона. А затем следует нажать «Разрешить».
Готовый результат удается легко отредактировать. Для этого требуется ручным способом исправить выделенное слово или надиктовать его снова. Результаты можно сохранить в личном кабинете или скачать на компьютер.
Сервис позволяет работать с 7 языками. При этом он имеет и недостаток. Если требуется транскрибация готового аудиофайла, он звучит в колонках. Это становится причиной дополнительных помех в виде эха.
Dragon Dictation представляет собой бесплатное приложение, которое подходит для устройств компании Apple. Программа дает возможность редактировать результаты, выбирая нужные слова из списка
При этом важно четко проговаривать все звуки, без пауз. Нежелательной является и интонация
Иногда можно столкнуться с ошибками в конце слова.
Существует много программ, которые облегчают работу
Приложение Dragon Dictation подойдет и для обладателей гаджетов Android. Они могут диктовать в него список покупок или другую важную информацию.
Следующим полезным сайтом станет RealSpeaker. Эта программа с легкостью переводит речь человека в текстовый формат. Она позволяет преобразовывать речь, которая звучит в микрофон. Он может быть встроен в ноутбук. Также удается преобразовывать формат, записанный в аудиофайлы.
Программа преобразовывает 13 языков мира. Существует бета-версия, которая функционирует как онлайн-сервис. Для этого необходимо выбрать русский язык, загрузить на сайт файл. При этом за его перевод приходится платить. После этого можно скопировать готовый текст. Чем больше размер файла, тем больше времени уйдет на преобразование.
Speechnotes считается альтернативой RealSpeaker, которая позволяет работать на Android. Текст удается редактировать автоматически и расставлять в нем знаки препинания. Этот вариант удобен для составления список или заметок. В результате удается получить качественный текст. Также существует платная премиум-версия.
Какой может быть заработок на транскрибации?
Последний раз, когда я транскрибировал видео, я брал заказ по тарифу 1000 рублей за один час. С учётом того, что у меня не много опыта в этом деле, на перевод 1 часа у меня уходил почти весь день, часов 7-8 точно.
Но так сложно оценить сколько на этом можно зарабатывать в месяц, есть куча факторов, из-за которых цена за минуту отличается.
Она может колебаться от 5 до 70 рублей.
Зависит это от:
- Срочности выполнения заказа.
- Качества записи — плохой звук, помехи и т.д.
- Количества голосов — диалоги, в которых ещё нужно понять кто говорит.
- От сложности текста и присутствия терминологии. Например, в медицине бывают термины, которые я лично бы не смог разобрать, не зная их.
- От индивидуальных требований заказчика — оформление, расстановка тайм-кодов, дословный перевод и т.д.
- Языка записи — в разы больше стоит транскрибация с английского аудио на английский текст или с английского на русский, или другой иностраный язык.
Также ваш заработок будет зависеть от качества и скорости выполнения задания. При серьёзном подходе в месяц будет выходить 10 000 — 30 000 рублей. Для небольшого городка это хорошие деньги.
Как увеличить доход от расшифровки аудио
Низкая оплата за минуту труда вынуждает всячески развиваться, а вместе с тем искать способы хотя бы частично, но облегчать половину рутинных действий и справляться с большим объемом заказов за то же время.
Вот парочка советов, как повысить доход:
- Скорость печати. Основа профессии. Чем быстрее набирается текст, тем серьезнее итоговый доход. При достаточной сноровке появится шанс даже не замедлять аудиозаписи или видеоролики, а набирать текст в синхронном режиме. Повысить скорость набора поможет практика или специальные сервисы для обучения вроде «Соло на клавиатуре».
- Вечные поиски. Хотя бы изредка, но стоит экспериментировать. Почему бы не попытаться набирать текст на английском языке, а после предложить заказчику еще и перевод подготовленных материалов? Альтернативный сценарий: рерайт или копирайт расшифрованного текста.
- Рефералы. Партнерская программа доступна не везде, но на биржам, где разрешают привлекать друзей и союзников, стоит отдавать предпочтение. Набранные в «команду» рефералы не принесут много дополнительной прибыли, но откроют доступ к пассивному доходу.
- Кооперация. Работодатели часто предлагают объемные заказы, включающие сотни минут аудио или видеозаписей. В гордом одиночестве справиться со столь серьезным комплектом невозможно, так почему бы не позвать друзей? Разделив работу на части, появится шанс выбить премию за проявленное рвение и не сойти с ума от надвигающейся рутины.
- Инструменты. Сервисы вроде Speechpad или Dictation разрешают диктовать текст голосом, а не переносить в Word вручную. Метод не лишен недостатков, но все же порой способен облегчить работу. Подготовленные материалы останется лишь подкорректировать: расставить знаки препинания, избавиться от ошибок и несогласования слов в предложениях.
ПОДВЕДЕНИЕ ИТОГОВ
Во второй части
заметки вы познакомились с основными программами, без которых не обходится ни
один транскрибатор.
Но это только начало,
потому что со временем, когда вы войдёте «во вкус», то непременно изъявите
желание облегчить и ускорить работу, при помощи дополнительных программ, для
ещё большего заработка.
И таких программ тоже
немало, например:
Punto Switcher – предназначена
для автоматического переключения раскладки клавиатуры.
AutoHotkey – используется
для создания мощных скриптов.
И многие, многие
другие.
Итак, для того чтобы
стать транскрибатором и начать зарабатывать свои первые деньги, информации,
предоставленной в двух частях заметки, вполне достаточно.
Но, я хочу ещё немного вас порадовать, поэтому приглашаю в третью часть заметки
(надеюсь последней) , в которой расскажу о секретах,
«фишках» и «примочках» в работе транскрибатора.
Если вам понравилась
заметка, подписывайтесь на мои обновления, чтобы первыми получать новые
заметки.
И не забывайте
делиться своими отзывами!
Всегда буду вам рада на страницах своего блога, у себя «дома». Ваша
Л.Г.