These docs are for v1.0.19. Click to read the latest docs for v1.0.25.

4. 音声合成

mimi TTS のスタートガイドです。
mimi の音声合成サービスを利用できるようになるまでの手順をまとめています。

Step1 : 事前準備

1. トークンの取得を実行して、アクセストークンを取得してください。この際、音声合成サービスが実行できるようスコープの指定を行い、アクセストークンを払い出すよう注意して下さい。

  • 参考:音声合成サービスの URI
    • https://apis.mimi.fd.ai/auth/nict-tts/http-api-service

Step2 : 音声合成サービスの実行

アクセストークンを発行したら、 音声合成サービスを実行することができます。
以下はHTTPサービスの利用例です。Authorizationヘッダには、発行したアクセストークンを指定します。パラメータのtextには入力文字列、engineにはnict、langには出力音声の言語を指定しています。

実行例

  • 下記の実行例では、項目 text に 「こんにちは」 のURLエンコード文字列%E3%81%93%E3%82%93%E3%81%AB%E3%81%A1%E3%81%AF を指定しています。
curl -X POST https://tts.mimi.fd.ai/speech_synthesis \
-H "Authorization: Bearer <accessToken>" \
-d text=%E3%81%93%E3%82%93%E3%81%AB%E3%81%A1%E3%81%AF \
-d engine=nict \
-d lang=ja > test.wav

応答例

合成音声のバイナリデータ( test.wav )が取得されます。メディアプレーヤーなどで再生すると「こんにちは」が流れます。


音声合成の詳細な情報については mimi TTS のドキュメント および API Reference を参照ください。


What’s Next