先ほどとは逆です。テキストから英語音声を作成します。
GoogleのText-to-Speechというサービスです。
教材としてテキストのみで音声が無いような場合に使えると思います。
Language / locale
English(United States)で良いでしょう。
Voice type
WaveNet
音声の生成に関する DeepMind の画期的な研究に基づいて開発された 90 以上の WaveNet 音声を利用すると、実際の人間による発話との差が大きく縮まります。
だそうです。WaveNetでとりあえず良いでしょう。
Voice Name
en-US-Wavenet-D
たくさんの音声が選べます。男性、女性、声質なども違います。とりあえずデフォルトのen-US-Wavenet-Dで良いでしょう。
Speed
読み上げ速度です。0.25 - 4.00まで選べます。特になければデフォルトの1.0で良いでしょう。
Pitch
音声の高さ(ピッチ)を、デフォルトから上下 20 セミトーン(半音 20 個分)の幅で調整可能です
だそうですが、デフォルトのままで良いと思います。
0 件のコメント:
コメントを投稿