Полезные инструменты для работы и творчества.
Артём КозоризАвтор Лайфхакера
по подписке, и платить за эксперимент или небольшую задачу не всегда хочется. К счастью, есть и бесплатные сервисы — они позволяют попробовать синтез речи без финансовых вложений и при этом дают результат, который звучит вполне естественно. Мы собрали самые интересные варианты — от известных до простых нейроинструментов.
1. OpenAI.fm
Нейросетевой инструмент от OpenAI, основанный на фирменных моделях компании и поддерживающий работу с несколькими десятками языков. Сервис делает ставку на естественность речи: голоса могут менять интонацию в зависимости от контекста и подстраиваться под вопросительные или эмоциональные реплики. Есть гибкая настройка тембра, скорости и пауз, а также управление нюансами произношения через промпт. Готовые аудиофайлы можно сохранять в MP3.Генератор доступен бесплатно, но с ограничением. За раз можно озвучивать 1 000 символов текста.Перейти на сайт ->
2. CloudTTS
Простая веб-платформа для синтеза речи, которая поддерживает больше сотни языков и предлагает десятки различных голосов. Сервис позволяет варьировать темп и громкость, а также менять эмоциональную окраску. Интерфейс максимально простой: нужно лишь ввести текст, нажать кнопку — и вы сразу получите готовую аудиодорожку в MP3. Удобная фишка — подсветка слов во время озвучивания, как в караоке.Сервис полностью бесплатный и работает без ограничений. Перейти на сайт ->
3. ElevenLabs
Самый популярный нейросетевой сервис для дубляжа видео, в котором есть и функция озвучки текста. Всего в пару кликов можно сгенерировать аудиоверсию на 40 различных языках, включая русский. Есть десятки различных голосов, передающих интонацию и эмоции, и возможность клонировать свой собственный. Также предусмотрены настройки речи и выбор нейросетевой модели, которая лучше подходит для определённых целей.В бесплатной версии ежемесячно выделяется 20 000 кредитов, что эквивалентно 20 минутам. Для увеличения лимитов нужна подписка от 5 долларов в месяц.Перейти на сайт ->
4. TTSFree
Онлайн-сервис для быстрого перевода текста в аудио, который работает на нейродвижках Google и Microsoft. В TTSFree можно озвучивать текст на 140 языках разными голосами с разными акцентами. Помимо выбора мужского или женского тембра, настройки включают скорость чтения и высоту тона, а также добавление фоновой музыки с компьютера или библиотек YouTube и Soundcloud. Всё работает без регистрации, но лучше завести аккаунт, чтобы увеличить лимиты. В бесплатной версии действует ограничение: не более 2 000 символов за один раз и максимум 100 конвертаций в месяц.Перейти на сайт ->
5. Steosvoice
Специализированный сервис озвучки на основе нейросетевых моделей, который работает через телеграм-бота. Steosvoice предлагает высококачественный синтез речи более чем 400 голосами, среди которых есть озвучка от профессиональных актёров, персонажей мультфильмов и игр — например Геральта из Ривии. В настройках можно указать скорость и высоту голоса, формат файла.Бесплатно доступна генерация 1 000 символов текста в день. Ограничение одного фрагмента — не более 250 символов. Платные тарифы, увеличивающие лимиты и допускающие коммерческое использование, стоят от 200 рублей в месяц.Перейти на сайт ->
6. Microsoft Edge Read Aloud
Преобразование текста в речь на базе фирменной технологии Microsoft из их же браузера. Без каких-либо ограничений длительности или объёма сервис можно использовать на платформе Hugging Face. Доступно, правда, всего два варианта голоса: мужской и женский.Зато сервис Microsoft Edge Read Aloud полностью бесплатный, не нужна даже регистрация.Перейти на сайт ->
7. SpeechSynthesis
Минималистичный сервис озвучки, который работает в десктопных и мобильных браузерах без регистрации. Голос создаётся прямо на устройстве, поэтому результат появляется мгновенно. В SpeechSynthesis доступны десятки языков, включая русский, с несколькими вариантами голосов для каждого. Среди настроек — скорость, тон, стиль и громкость.Инструмент полностью бесплатный, но за один раз обрабатывает до 10 000 символов текста.Перейти на сайт ->
8. Voicemaker
Эта нейросеть для озвучки текста позволяет работать со 120 языками мира. База голосов просто огромная — их несколько сотен, причём как говорящих на одном языке, так и мультиязычных. Настройки позволяют добавлять паузы, менять громкость и скорость, придавать определённую интонацию. Результат можно скачать в форматах MP3, WAV, OGG, AAC или OPUS.В бесплатной версии есть ограничение на объём текста за конвертацию — не более 250 символов, что не много. Результат можно использовать только для персональных нужд, но вставка на YouTube разрешена с указанием в описании. Платные тарифы от 5 долларов в месяц снимают ограничения.Перейти на сайт ->
9. NaturalReader
Продвинутый нейросетевой синтезатор речи с поддержкой свыше 50 популярных языков мира, включая русский. Озвучивать текст можно десятком разных голосов, которые различаются акцентом, эмоциями, возрастом и полом диктора. Есть мобильное приложение, в котором с помощью NaturalReader получится даже зачитывать книги, показывая страницы через камеру.Бесплатно можно озвучивать текст, применяя сервис как плеер. Для скачивания аудиофайлов нужна подписка от 5 долларов в месяц.Перейти на сайт ->
10. Yandex SpeechKit
Неплохой инструмент для синтеза речи от «Яндекса», работающий на нейросетевых моделях компании. Yandex SpeechKit умеет озвучивать тексты на русском, казахском, узбекском, английском, немецком и иврите. На выбор доступно 11 голосов, среди которых мужские и женские. Настройки позволяют изменять скорость произношения, а также указывать стиль: нейтральный, дружелюбный, шёпот.В бесплатной версии есть лимит на объём текста — не более 500 символов за один раз.Перейти на сайт ->
11. TTSMP3
Лаконичный инструмент озвучки с синтезированными и нейросетевыми голосами, который выделяется поддержкой тегов SSML. С их помощью можно управлять интонацией, расставлять паузы и даже акцентировать отдельные слова, чтобы получить более естественное произношение. Поддерживаются все популярные языки, включая русский, а результат сохраняется в MP3-формате.Бесплатно можно озвучить до 3 000 символов в день.Перейти на сайт ->
12. Apihost
Простой сервис с несколькими нейросетевыми моделями, который позволяет получать аудиоверсии текстов на более чем 30 языках. Доступных голосов — десятки, и звучат они довольно живо. Можно менять тон с нейтрального на дружеский или раздражённый, подстраивать высоту голоса, корректировать скорость речи и продолжительность пауз.Бесплатный аккаунт предполагает преобразование не более 1 000 символов за одну генерацию.Перейти на сайт ->
13. OpenVoice
Простая нейросеть для озвучки текста, с помощью которой можно клонировать голос по референсу в виде аудиофайла и вдальнейшем использовать его. Правда, только на английском. Из настроек доступен выбор интонации: дружелюбный голос, печальный, радостный, раздражённый, испуганный.Сервис бесплатен, но имеет ограничение в 200 символов на одну операцию.Перейти на сайт ->
14. HierSpeech++
Ещё одна простая нейросеть для озвучки текста, которая обучена на LibriTTS и пока что поддерживает только английский язык. Сервис использует референс голоса, который можно загрузить в виде аудиофайла или записать через микрофон. Можно применить HierSpeech++ и для русского, но результат будет как если бы текст читал иностранец. Возможно, пригодится для определённых ситуаций, когда нужен голос с сильным акцентом.Нейросеть бесплатна, ограничение на объём текста составляет 200 символов.Перейти на сайт ->
15. Robivox
Неплохой сервис с более чем сотней поддерживаемых языков, который поможет озвучить текст десятью различными голосами. Настроек немного: можно добавить паузы и поставить ударение, а также выбрать формат загружаемого аудиофайла.В бесплатной версии доступна обработка текстов объёмом не более 100 символов, поэтому Robivox годится лишь для коротких реплик.Перейти на сайт ->
Лайфхакер