サービス対応表
x-mimi-process
の設定値とサービス
x-mimi-process
の設定値とサービスエンドポイント( mimi API のエンドポイント一覧 )が service.mimi.fd.ai
である mimi API を利用する際には mimi が定義するカスタムHTTPヘッダ x-mimi-process
で利用するサービスを指定します。
ここでは、x-mimi-process
の設定値とそれに対応するサービスの種類とその概要について記載しています。
詳細な情報については、各サービスのドキュメントおよび API Reference を参照ください。
サービス対応表
x-mimi-process に設定する値 | 説明 |
---|---|
asr | mimi ASR 音声認識 対応言語: ja (日本語) |
nict-asr | mimi ASR powered by NICT 音声認識 (NICT 音声認識エンジン) 対応言語: ja (日本語) , en (英語), es (スペイン語), fr (フランス語), id (インドネシア語), ko (韓国語), my (ミャンマー語), th (タイ語), vi (ベトナム語), zh (中国語簡体字), zh-TW (中国語繁体字), pt-BR(ブラジルポルトガル語), fil(フィリピン語) |
google-asr | Google Cloud Speech-to-Text ( API 連携) 音声認識 ※ google-asr を使用するには、別途契約が必要となります。 対応言語: x-mimi-input-language にはGoogle の 言語サポート に記載されている表記通りに指定してください。 |
srs | mimi SRS 話者識別 入力された音声の話者を識別するサービスです。 |
lid | mimi LID 言語識別 リクエストヘッダ x-mimi-process にて lid を指定することで言語識別機のみを実行できます。 lidasr とは異なり、音声認識を実行しません。 入力された音声で発話されている言語が何語かを識別し、その結果だけを返します。 lid と lidasr をカンマ区切りで同時に指定することはできません。 |
lidasr | mimi LID 言語識別 + mimi ASR powered by NICT 音声認識 リクエストヘッダ x-mimi-process にて lidasr を指定することで言語識別と音声認識の両方のサービスを使用できます。 入力された音声で発話されている言語が何語かを識別し、最も信頼度の高い言語で音声認識を行い、言語識別と音声認識のそれぞれの結果を返却します。 音声認識の入力と出力は mimi ASR powered by NICT に準じます。 lid と lidasr をカンマ区切りで同時に指定することはできません。 |
air | mimi AIR 態度認識 入力された音声のパラ言語(音声のイントネーションや声色)に込められた話し手の態度を識別するサービスです。 対応言語: ja (日本語) |
emo-categorical | mimi EMO 感情認識 入力された音声の感情を識別するサービスです。 対応言語: ja (日本語) |
複数サービス指定
利用するサービスは、カンマ(,
)区切りで複数指定可能です。複数指定する場合、指定するすべてのサービスが必要とするパラメータの指定が必要です。複数指定したサービス間で重複するパラメータがある場合はひとつだけ指定するようにしてください。パラメータの指定が不足している場合の挙動、同じパラメータを複数指定してリクエストした場合の挙動は保証されません。x-mimi-process
を必要としない API 仕様のサービスは、複数指定の対象外であるため指定できません。サービス対応表に記載のある x-mimi-process
を必要とする API 仕様のサービスであっても、別途契約を必要とするサービスや同時に指定できないサービスがあります。
下記のタブ "複数サービス指定の cURL リクエスト例" で、いずれのサービスでもアクセストークンをパラメタに設定する必要がある API 仕様なのですが、アクセストークン指定を3回指定するのではなくひとつだけ指定しています。
curl -X POST https://service.mimi.fd.ai \
-H "Content-Type: audio/x-pcm;bit=16;rate=16000;channels=1" \
-H "x-mimi-process:air,lidasr,srs" \
-H "x-mimi-srs-speaker-group-id: <話者グループ ID>" \
-H "x-mimi-input-language:ja" \
-H "Authorization: Bearer <accessToken>" \
--data-binary @/path/to/audio.raw | jq .
{
"type": "air",
"session_id": "29aebe24-326b-11ec-9faa-42010a920024",
"status": "recog-finished",
"response": {
"time_interval": {
"start": 300,
"end": 5200
},
"label": "agreement",
"scores": {
"question": 7.805005589034408e-05,
"stalling": 1.3154452972230501e-05,
"agreement": 0.9999086856842041,
"disagreement": 8.85088198288031e-08
}
}
}
{
"session_id": "fc30b1bc-eb20-4298-b84c-47bbd28cd353",
"status": "recog-finished",
"type": "lid#ja|en|zh|ko",
"response": [
{
"lang": "ja",
"score": 0.51228
},
{
"lang": "en",
"score": 0.485335
},
{
"lang": "ko",
"score": 0.001652
},
{
"lang": "zh",
"score": 0.000734
}
]
}
{
"status": "recog-finished",
"type": "srs#identification#69c30a37dc0e462ea01ee8f0a4bae578",
"response": {
"speaker": [
{
"confidence": 0.99721,
"speaker_id": ""
},
{
"confidence": 0.00279,
"speaker_id": "6d4fd7b20a564dbd8a5335d7f64a9278"
}
]
},
"session_id": "29ae547a-326b-11ec-a243-42010a920075"
}
{
"lang": "ja",
"type": "asr#nictlvcsr",
"session_id": "1a71df93-5a1f-47fb-8178-f18e6acf4e47",
"status": "recog-finished",
"response": [
{
"result": "ちょっと|チョット|ちょっと|副詞-助詞類接続||||"
},
{
"result": "遅い|オソイ|遅い|形容詞-自立|形容詞・アウオ段|基本形||"
},
{
"result": "昼食|チュウショク|昼食|名詞-一般||||"
},
{
"result": "を|ヲ|を|助詞-格助詞-一般||||"
},
{
"result": "とる|トル|とる|動詞-自立|五段・ラ行|基本形||"
},
{
"result": "ため|タメ|ため|名詞-非自立-副詞可能||||"
},
{
"result": "ファミリーレストラン|ファミリーレストラン|ファミリーレストラン|名詞-一般||||"
},
{
"result": "に|ニ|に|助詞-格助詞-一般||||"
},
{
"result": "入っ|ハイッ|入る|動詞-自立|五段・ラ行|連用タ接続||"
},
{
"result": "た|タ|た|助動詞|特殊・タ|基本形||"
},
{
"result": "の|ノ|の|名詞-非自立-一般||||"
},
{
"result": "です|デス|です|助動詞|特殊・デス|基本形||"
},
{
"result": "|||SENT-START-END||||"
},
{
"result": "|||UTT-END||||"
}
]
}
Updated almost 2 years ago