ページビューの合計

2022年11月19日土曜日

文字から英語音声を合成する(Text-to-Speech )

先ほどとは逆です。テキストから英語音声を作成します。

GoogleのText-to-Speechというサービスです。

教材としてテキストのみで音声が無いような場合に使えると思います。

Language / locale

English(United States)で良いでしょう。

Voice type

WaveNet

音声の生成に関する DeepMind の画期的な研究に基づいて開発された 90 以上の WaveNet 音声を利用すると、実際の人間による発話との差が大きく縮まります。

だそうです。WaveNetでとりあえず良いでしょう。 

Voice Name

en-US-Wavenet-D

たくさんの音声が選べます。男性、女性、声質なども違います。とりあえずデフォルトのen-US-Wavenet-Dで良いでしょう。

Speed

読み上げ速度です。0.25 - 4.00まで選べます。特になければデフォルトの1.0で良いでしょう。

Pitch

音声の高さ(ピッチ)を、デフォルトから上下 20 セミトーン(半音 20 個分)の幅で調整可能です

だそうですが、デフォルトのままで良いと思います。

 

0 件のコメント:

コメントを投稿

究極のビジネス英語 リスニング Vol.1 03. 電話会議で初顔合わせ

03. 電話会議で初顔合わせ 担当同士での同意が得られて2社で初めての電話会議になったところからです。 電話会議のようですが、今時ならZoomやGoogle Meet, Skypeなどを使ったビデオ会議になるでしょうね。 テキストを読み込んでいくと色々気になる表現が出てきたのでメ...