音声認識（ Google™ Cloud Speech-to-Text ）を行う

post

https://asr.mimi.fd.ai/v1/recognize/google

Recent Requests

Time	Status	User Agent
Retrieving recent requests…

Loading…

📘
音声認識（ Google™ Cloud Speech-to-Text ）を利用したい
音声認識（ Google™ Cloud Speech-to-Text ）を使用するには別途契約が必要です

📘
mimi が定義するカスタム HTTP ヘッダ
mimi が定義するカスタム HTTP ヘッダ（ x-mimi- で始まるヘッダ）に設定する値は、大文字小文字を区別しています。例えば "x-mimi-input-language" の値に "ja" は指定できますが、 "JA" は指定できません。
また、同じヘッダが同一のリクエスト内で複数行指定された場合は、いずれか一つのみが有効になりますので極力1種類1行となるように指定してください。

API 実行に必要なスコープ

HTTP / WebSocket どちらを利用するかによって必要なスコープは異なります。


https://apis.mimi.fd.ai/auth/google-asr/http-api-service https://apis.mimi.fd.ai/auth/google-asr/websocket-api-service

実行

HTTP リクエスト実行例は本ページ右の "REQUEST" を参照ください。

応答

応答例

本ページの応答例（画面右 "RESPONSE" で "200 - Result" を選択）を参照ください。

応答結果 JSON

各要素の型は本ページの "RESPONSE" を参照ください。
（ resonse ステータス "200" をクリック）

キー	内容
response	認識結果オブジェクトの配列
result	発話テキスト
confidence	発話開始と発話終了のミリ秒数（音声データの開始から起算）の配列
session_id	セッションID
status	音声認識結果のステータス
type	音声認識の型

Body Params

audio data(binary)

file

required

リクエストボディ全体が Content-Type で指定したフォーマットのバイナリデータ。cURL コマンドのオプション --data-binary の引数としてファイルを指定する場合は 先頭に @ をつけなければ送信できない ことに留意。

Headers

Authorization

string

required

Defaults to Bearer <accessToken>

OAuth2 準拠の Bearer トークンとして発行された mimi のアクセストークン。実行したいサービスに対応するスコープを指定して発行したアクセストークンが必要。アクセストークンの取得方法についてはトークンの取得または認証／認可操作を参照。

x-mimi-input-language

string

Defaults to ja

入力音声の言語コード。Google 公式サイトの言語サポートのページを参照。 x-mimi-input-language にはこちらに記載されている表記通りに指定してください。

string

enum

Defaults to application/json

Generated from available response content types

Allowed:

Responses

音声認識（ Google™ Cloud Speech-to-Text ）を利用したい

mimi が定義するカスタム HTTP ヘッダ

API 実行に必要なスコープ

実行

応答

応答例

応答結果 JSON

200200

401401