英語晴れ: 文字から英語音声を合成する（Text-to-Speech ）

2022年11月19日土曜日

先ほどとは逆です。テキストから英語音声を作成します。

GoogleのText-to-Speechというサービスです。

教材としてテキストのみで音声が無いような場合に使えると思います。

English(United States)で良いでしょう。

WaveNet

音声の生成に関する DeepMind の画期的な研究に基づいて開発された 90 以上の WaveNet 音声を利用すると、実際の人間による発話との差が大きく縮まります。

だそうです。WaveNetでとりあえず良いでしょう。

en-US-Wavenet-D

たくさんの音声が選べます。男性、女性、声質なども違います。とりあえずデフォルトのen-US-Wavenet-Dで良いでしょう。

読み上げ速度です。0.25 - 4.00まで選べます。特になければデフォルトの1.0で良いでしょう。

音声の高さ（ピッチ）を、デフォルトから上下 20 セミトーン（半音 20 個分）の幅で調整可能です

だそうですが、デフォルトのままで良いと思います。

英語晴れ