音声認識( Google™ Cloud Speech-to-Text )を行う

📘

音声認識( Google™ Cloud Speech-to-Text )を利用したい

音声認識( Google™ Cloud Speech-to-Text )を使用するには別途契約が必要です

📘

mimi が定義するカスタム HTTP ヘッダ

mimi が定義するカスタム HTTP ヘッダ( x-mimi- で始まるヘッダ ) に設定する値は、大文字小文字を区別しています。例えば "x-mimi-process" の値に "asr" は指定できますが、 "ASR" は指定できません。
また、同じヘッダが同一のリクエスト内で複数行指定された場合は、いずれか一つのみが有効になりますので極力1種類1行となるように指定してください。

API 実行に必要なスコープ

HTTP / WebSocket どちらを利用するかによって必要な スコープ は異なります。

https://apis.mimi.fd.ai/auth/google-asr/http-api-service
https://apis.mimi.fd.ai/auth/google-asr/websocket-api-service

実行

HTTP リクエスト実行例は本ページ右の "REQUEST" を参照ください。

応答

応答例

本ページの応答例( 画面右 "RESPONSE" で "200 - Result" を選択)を参照ください。

応答結果 JSON

各要素の型は本ページの "RESPONSE" を参照ください。
( resonse ステータス "200" をクリック)

キー

内容

response

認識結果オブジェクトの配列

    result

発話テキスト

    confidence

発話開始と発話終了のミリ秒数(音声データの開始から起算)の配列

session_id

セッションID

status

音声認識結果のステータス

type

音声認識の型

Language