Если робот неверно поставил ударение в слове (что бывает весьма редко), то можно это исправить, добавив знак "*" (звездочка) ПОСЛЕ необходимой ударной гласной в слове.
В коде ударные гласные выделяются светло-зеленым цветом
Чтобы робот сделал вынужденную паузу, можно добавить несколько знаков "-" (дефис). Чем больше знаков подряд будет, тем длиннее пауза. Один дефис соответствует примерно 200 миллисекундам. Максимальная длина паузы - 5 минут (= 300 секунд = 300 000 миллисекунд)
Также паузы можно задать с помощью конструкции (-кол-во миллисекунд паузы-), например (-1530-), где 1530 - кол-во миллисекунд, которое должна продлиться пауза.
Теперь паузы доступны для всех голосов!
В коде паузы выделяются светло-голубым цветом.
Это режим пока работает в режиме Beta теста (может выдавать ошибки и работать не стабильно) (работает пока только для русского языка).
Фонемы — это минимальные сегментные единицы языка (проще говоря - звуки). Применять фонемы при синтезе речи может быть полезно если нейросеть не понимает ударения через * или же неверно произносит слово.
Некоторые голоса поддерживают фонемы (подробнее о том, какие указано здесь). Это значит, что Вы сами можете задать произношение конкретного слова с помощью специального алфавита (который мы сами разработали), который очень похож на фонетический разбор слова, который все делали в школе (а Вы думали не пригодится? Пригодится). Также Вы можете использовать IPA (Международный фонетический алвавит) (читать Википедию).
Фонемы можно использовать двумя способами.
Во втором столбце (USSML) указаны все символы (через пробел), которые могут использоваться для обозначения конкретной фонемы (то есть они означают одно и тоже).
IPA | USSML | Описание | Пример |
---|---|---|---|
b | б | твердая "б" (voiced bilabial plosive) |
рыба [rɨbə] /рыба/ |
bʲ | б' | мягкая "б" (palatalized voiced bilabial plosive) |
бюро [bʲʊro] /б"уро/ |
d | д | твердая "д" (voiced alveolar plosive) |
дом [dom] /дом/ |
dʲ | д' | мягкая "д" (palatalized voiced alveolar plosive) |
дядя [dʲadʲə] /д"ад"а/ |
f | ф | твердая "ф" (voiceless labiodental fricative) |
форт [fort] /форт/ |
fʲ | ф' | мягкая "ф" (palatalized voiceless labiodental fricative) |
финал [fʲɪnal] /ф"инал/ |
g | г | твердая "г" (voiced velar plosive) |
гол [gol] /гол/ |
ɡʲ | г' | мягкая "г" (palatalized voiced velar plosive) |
герой [ɡʲɪroj] /г"ирой/ |
j | й | звук "й" (palatal approximant) |
я [ja] /йа/, дизайн [dʲzajn] /д"зайн/ |
k | к | твердая "к" (voiceless velar plosive) |
кот [kot] /кот/, ку [ku] /ку/ |
kʲ | к' | мягкая "к" (palatalized voiceless velar plosive) |
кино [kʲɪno] /к"ино/, кю [kʲu] /к"у/ |
l | л | твердая "л" (alveolar lateral approximant) |
луч [lʊt͡ɕ] /луч/ |
lʲ | л' | мягкая "л" (palatalized alveolar lateral approximant) |
лес [lʲes] /л"ес/ |
m | м | твердая "м" (bilabial nasal) |
мама [mamə] /мама/ |
mʲ | м' | мягкая "м" (palatalized bilabial nasal) |
меч [mʲet͡ɕ] /м"еч/ |
n | н | твердая "н" (alveolar nasal) |
нос [nos] /нос/ |
nʲ | н' | мягкая "н" (palatalized alveolar nasal) |
няня [nʲanʲə] /н"ан"а/ |
p | п | твердая "п" (voiceless bilabial plosive) |
папа [papə] /папа/ |
pʲ | п' | мягкая "п" (palatalized voiceless bilabial plosive) |
пена [pʲenə] /п"ена/ |
r | р | твердая "р" (alveolar trill) |
рок [rok] /рок/ |
rʲ | р' | мягкая "р" (palatalized alveolar trill) |
рис [rʲis] /р"ис/ |
s | с | твердая "с" (voiceless alveolar fricative) |
суд [sʊd] /суд/ |
sʲ | с' | мягкая "с" (palatalized voiceless alveolar fricative) |
сено [sʲenə] /с"ена/, русь [rʊsʲ] /рус"/ |
ɕ: | щ | шипящая "щ" (long voiceless alveolo-palatal fricative) |
щит [ɕ:it] /щит/ |
ʂ | ш | шипящая "ш" (voiceless retroflex fricative) |
шест [ʂest] /шест/ |
t | т | твердая "т" (voiceless alveolar plosive) |
танк [tank] /танк/ |
tʲ | т' | мягкая "т" (palatalized voiceless alveolar plosive) |
тётя [tʲotʲə] /т"от"а/ |
t͡s | ц | звонкая "ц" (voiceless alveolar affricate) |
царь [t͡sarʲ] /цар"/ |
t͡ɕ | ч | глухая "ч" (voiceless alveolo-palatal affricate) |
чуть [t͡ɕʉtʲ] /чʉт"/ |
v | в | твердая "в" (voiced labiodental fricative) |
вон [von] /вон/ |
vʲ | в' | мягкая "в" (palatalized voiced labiodental fricative) |
весы [vʲɪsɨ] /в"исы/ |
x | х | твердая "х" (voiceless velar fricative) |
хор [xor] /хор/ |
xʲ | х' | мягкая "х" (palatalized voiceless velar fricative) |
химия [xʲimʲə] /х"им"а/ |
z | з | твердая "з" (voiced alveolar fricative) |
зуб [zub] /зуб/ |
zʲ | з' | мягкая "з" (palatalized voiced alveolar fricative) |
зима [zʲɪma] /з"има/ |
ʑ: | ж: | буквосочетания "зж" и "жж" (long voiced alveolo-palatal fricative) |
езжу [jeʑːʊ] /йеʑ*у/, вожжи [voʑ:ɨ̞] /вож:И/ |
ʐ | ж | короткая "ж" (voiced retroflex fricative) |
жена [ʐɨ̞na] /жИна/ |
ə | о э а | Шва — безударные "а", "о" или "э" (mid central vowel) |
корова [kɐrovə] /кАрова/, молоко [məlɐ′ko] /малА′ко/ |
a | а* | ударная "а" или "я" (open front unrounded vowel) |
там [tam] /там/, мяч [mʲat͡ɕ] /м"ач/, яма [jamə] /йама/ |
ɐ | А | безударная "а" (near-open central vowel |
каравай [kərɐvaj] /карАвай/, голова [gəlɐva] /галАва/ |
e | е* | ударная "е" (close-mid front unrounded vowel) |
печь [pʲet͡ɕ] /п"еч/ |
ɛ | э* | ударная "э" (open-mid front unrounded vowel) |
это [ɛtə] /эта/ |
i | и* | ударная "и" (close front unrounded vowel) |
лист [lʲist] /л"ист/ |
ɪ | е и | "е" или "и" после палатализованной согласной в безударном слоге (near-close front unrounded vowel) |
дерево [dʲerʲɪvə] /д"ер"ива/ |
ɨ̞ | Е И | "е" или "и" после непалатализованной согласной в безударном слоге (near-close central unrounded vowe) |
жена [ʐɨ̞na] /жИна/ |
ɨ | ы* | ударная "ы" (close central unrounded vowel) |
рыло [rɨlə] /рыла/ |
o | о* | ударная "о" (close-mid back rounded vowel) |
кот [kot] /кот/ |
u | у* | ударная "у" или "ю" (close back rounded vowel) |
муж [muʂ] /муш/, вьюга [vʲugə] /в"уга/ |
ʊ | у | безударная "у" или "ю" (near-close back rounded vowel) |
сухой [sʊxo̞j] /сухо̞й/, мужчина [mʊɕːinə] /муɕ*ина/ |
Чтобы заставить программу произносить разные фразы разными голосами (голоса могут повторяться) необходимо:
В коде голоса-авторы обозначены жирным шрифтом красного цвета на светло-желтом фоне
Если Вы не определились с голосом для озвучки, то Вы можете использовать переменные. Каждое объявление переменной должно начинаться со слова "var". Далее идет пробел, слово для замены, пробел и слово, на которое надо заменить. Для голоса автора это будет выглядеть как показано ниже
Если Вы не определились с голосом для озвучки, то Вы можете использовать переменные. Каждое объявление переменной должно начинаться со слова "var". Далее идет пробел, слово для замены, пробел и слово, на которое надо заменить. Для голоса автора это будет выглядеть как показано ниже
В коде переменные подсвечены синим цветом
Если Вам необходимо разбить озвучку на несколько частей, но Вы не хотите пользоваться аудиоредактором или несколько раз озвучивать несколько частей текста, то просто разбейте текст на части с помощью конструкции === (эта конструкция должна быть отдельной строчкой).
Остальной процесс озвучки не будет ничем отличаться, Вы также на выходе получите полный аудиофайл. Но при скачивании Вы сможете загрузить zip архив в котором будут все части Вашего текста с названиями 0_segment_of_act.mp3, 1_segment_of_act.mp3... Также в архиве будет и полный файл со всеми частями под названием full_speech.mp3
В коде места разбиения будут подсвечены розовым цветом.
Если во время нажатия на кнопку "Озвучить текст" в поле вода будет выделена фраза, то при озвучке будет
использоваться только она. Это можно использовать для отладки озвучки небольших
фраз.
Даже если Вы уже объявили переменные и не выделили их, то переменные все равно будут действовать. НЕ
ЗАБУДЬТЕ ВЫДЕЛИТЬ И ГОЛОС АВТОРА (!ГОЛОС:), если хотите, чтобы отрывок был озвучен
в режиме диалога (несколькими голосами)
Чтобы робот никак не учитывал строку (ни автора, ни фразу, ни переменную), начните ее со знака "#". Также, даже если курсор не в начале строки, то комбинацией "Ctrl+/" можно ее быстро закомментировать и раскомментировать
В коде закомментированые строки начинаются с # и подсвечиваются серым цветом
- Мужской голос
- Женский голос
- Премиум мужской голос
- Премиум женский голос
- Роботизированный мужской голос
- Роботизированный женский голос
Список доступных голосов представлен в этой статье, а также мы поддерживаем ВСЕ голоса Google Cloud TTS и Microsoft Azure TTS. Для этого достаточно вместо привычного голоса писать полное имя голоса из списка, например:
То есть, все голоса (даже которых нет в наших списках) также поддерживаются. Кстати, Вы можете дать им свои имена. Для этого используйте переменные
На странице "озвучки текста" в бесплатной и платной версиях используется настоящий редактор кода. Это сделано для того, чтобы в процессе написания вы могли видеть подсветку синтаксиса (голосов робота, пауз, ударений). Также, благодаря такому решению, Вы можете использовать привычные Вам сочетания клавиш (горячие клавиши - hotKeys). Вот примеры некоторых из них:
Вверху находятся 5 выпадающих списков, в которых Вы можете выбрать язык озвучки автора, его голос, формат выходного файла, а также темп и высоту речи. Ниже располагается редактор кода для Вашего текста. В него Вы можете ввести и обычный тест, и использовать наш "код", указанный выше. Ниже расположена кнопка "озвучить", рядом с которой располагается стоимость озвучки. Обратите, что указана примерная цена за озвучку всего текста. Чтобы узнать точную цену - кликните по кнопке "Рассчитать", тогда на кнопке "Озвучить" будет написана точная цена озвучки данного фрагмента. Еще ниже располагается аудиодорожка с Вашим файлом. Вы можете ее прослушать и/или скачать. Внешний вид интерфейса представлен ниже.
Поделитесь с друзьями ссылкой на сервис!