These docs are for v1.0.19. Click to read the latest docs for v1.0.28.

サービス対応表

x-mimi-process の設定値とサービス

エンドポイント( mimi API のエンドポイント一覧 )が service.mimi.fd.ai である mimi API を利用する際には mimi が定義するカスタムHTTPヘッダ x-mimi-process で利用するサービスを指定します。
ここでは、x-mimi-process の設定値とそれに対応するサービスの種類とその概要について記載しています。
詳細な情報については、各サービスのドキュメントおよび API Reference を参照ください。

サービス対応表

x-mimi-process に設定する値説明
asrmimi ASR 音声認識

対応言語:
ja (日本語)
nict-asrmimi ASR powered by NICT 音声認識
(NICT 音声認識エンジン)

対応言語:
ja (日本語) , en (英語), es (スペイン語), fr (フランス語), id (インドネシア語), ko (韓国語), my (ミャンマー語), th (タイ語), vi (ベトナム語), zh (中国語簡体字), zh-TW (中国語繁体字), pt-BR(ブラジルポルトガル語), fil(フィリピン語)
google-asrGoogle Cloud Speech-to-Text ( API 連携) 音声認識

※ google-asr を使用するには、別途契約が必要となります。

対応言語:
x-mimi-input-language にはGoogle の 言語サポート に記載されている表記通りに指定してください。
srsmimi SRS 話者識別

入力された音声の話者を識別するサービスです。
lidmimi LID 言語識別

リクエストヘッダ x-mimi-process にて lid を指定することで言語識別機のみを実行できます。 lidasr とは異なり、音声認識を実行しません。 入力された音声で発話されている言語が何語かを識別し、その結果だけを返します。

lid と lidasr をカンマ区切りで同時に指定することはできません。
lidasrmimi LID 言語識別 + mimi ASR powered by NICT 音声認識

リクエストヘッダ x-mimi-process にて lidasr を指定することで言語識別と音声認識の両方のサービスを使用できます。 入力された音声で発話されている言語が何語かを識別し、最も信頼度の高い言語で音声認識を行い、言語識別と音声認識のそれぞれの結果を返却します。 音声認識の入力と出力は mimi ASR powered by NICT に準じます。

lid と lidasr をカンマ区切りで同時に指定することはできません。
airmimi AIR 態度認識

入力された音声のパラ言語(音声のイントネーションや声色)に込められた話し手の態度を識別するサービスです。

対応言語:
ja (日本語)
emo-categoricalmimi EMO 感情認識

入力された音声の感情を識別するサービスです。

対応言語:
ja (日本語)

複数サービス指定

利用するサービスは、カンマ(,)区切りで複数指定可能です。複数指定する場合、指定するすべてのサービスが必要とするパラメータの指定が必要です。複数指定したサービス間で重複するパラメータがある場合はひとつだけ指定するようにしてください。パラメータの指定が不足している場合の挙動、同じパラメータを複数指定してリクエストした場合の挙動は保証されません。x-mimi-process を必要としない API 仕様のサービスは、複数指定の対象外であるため指定できません。サービス対応表に記載のある x-mimi-process を必要とする API 仕様のサービスであっても、別途契約を必要とするサービスや同時に指定できないサービスがあります。

下記のタブ "複数サービス指定の cURL リクエスト例" で、いずれのサービスでもアクセストークンをパラメタに設定する必要がある API 仕様なのですが、アクセストークン指定を3回指定するのではなくひとつだけ指定しています。

curl -X POST https://service.mimi.fd.ai \ -H "Content-Type: audio/x-pcm;bit=16;rate=16000;channels=1" \ -H "x-mimi-process:air,lidasr,srs" \ -H "x-mimi-srs-speaker-group-id: <話者グループ ID>" \ -H "x-mimi-input-language:ja" \ -H "Authorization: Bearer <accessToken>" \ --data-binary @/path/to/audio.raw | jq .
{ "type": "air", "session_id": "29aebe24-326b-11ec-9faa-42010a920024", "status": "recog-finished", "response": { "time_interval": { "start": 300, "end": 5200 }, "label": "agreement", "scores": { "question": 7.805005589034408e-05, "stalling": 1.3154452972230501e-05, "agreement": 0.9999086856842041, "disagreement": 8.85088198288031e-08 } } } { "session_id": "fc30b1bc-eb20-4298-b84c-47bbd28cd353", "status": "recog-finished", "type": "lid#ja|en|zh|ko", "response": [ { "lang": "ja", "score": 0.51228 }, { "lang": "en", "score": 0.485335 }, { "lang": "ko", "score": 0.001652 }, { "lang": "zh", "score": 0.000734 } ] } { "status": "recog-finished", "type": "srs#identification#69c30a37dc0e462ea01ee8f0a4bae578", "response": { "speaker": [ { "confidence": 0.99721, "speaker_id": "" }, { "confidence": 0.00279, "speaker_id": "6d4fd7b20a564dbd8a5335d7f64a9278" } ] }, "session_id": "29ae547a-326b-11ec-a243-42010a920075" } { "lang": "ja", "type": "asr#nictlvcsr", "session_id": "1a71df93-5a1f-47fb-8178-f18e6acf4e47", "status": "recog-finished", "response": [ { "result": "ちょっと|チョット|ちょっと|副詞-助詞類接続||||" }, { "result": "遅い|オソイ|遅い|形容詞-自立|形容詞・アウオ段|基本形||" }, { "result": "昼食|チュウショク|昼食|名詞-一般||||" }, { "result": "を|ヲ|を|助詞-格助詞-一般||||" }, { "result": "とる|トル|とる|動詞-自立|五段・ラ行|基本形||" }, { "result": "ため|タメ|ため|名詞-非自立-副詞可能||||" }, { "result": "ファミリーレストラン|ファミリーレストラン|ファミリーレストラン|名詞-一般||||" }, { "result": "に|ニ|に|助詞-格助詞-一般||||" }, { "result": "入っ|ハイッ|入る|動詞-自立|五段・ラ行|連用タ接続||" }, { "result": "た|タ|た|助動詞|特殊・タ|基本形||" }, { "result": "の|ノ|の|名詞-非自立-一般||||" }, { "result": "です|デス|です|助動詞|特殊・デス|基本形||" }, { "result": "|||SENT-START-END||||" }, { "result": "|||UTT-END||||" } ] }

Did this page help you?