mimi SRS HTTP Service

この項では話者識別の HTTP API について述べます。

📘
事前準備について
話者識別サービスを利用するには、事前に準備が必要です。
どのような準備が必要であるかを含め、話者識別サービス利用についての全体像の理解には話者識別サービスの概要を参照ください。

接続情報


URL: https://service.mimi.fd.ai

概要

話者識別の HTTP API では、事前準備各種と話者識別サービスが利用できます。
話者識別サービス API のプロトコルは HTTP および WebSocket です。

話者識別では入力音声に対して、リクエストで指定した話者グループに属する話者についての信頼度を推定します。

実行結果は JSON 形式で返されます。
その JSON 形式の応答の構成、結果は実行する API によって異なります。
詳しくは後述の "API Reference" および "応答例" を参照ください。

入力音声が極端に短い場合には、不正なデータとみなされエラーとなります。

認証

HTTP APIサービスをご利用の際には実行したいサービスに対応するスコープ（スコープ一覧）を指定して発行したアクセストークンが必要です。
mimi API Console 画面からの操作で取得するにはトークンの取得を参照ください。
APIの実行で取得するには認証／認可操作を参照ください。

クエリ文字列でのリクエスト

HTTP ヘッダを使った実行時設定の指定ができない場合は、 HTTP ヘッダの代わりにクエリ文字列を使って実行時設定を指定することができます。
クエリ文字列による HTTP ヘッダの代替の記述を参照ください。

API Reference

話者識別に関する API の詳細な情報については、以下のドキュメントおよび API Reference を参照ください。

事前に必要な各種操作の API

ドキュメント "学習のためのAPI" の API 一覧を参照

話者識別サービス利用の API

※ 話者識別サービスを利用するには、事前に必要な各種操作が行われている必要があります

API Reference 話者識別を行う

実行

ここでは、事前準備が整っている前提で話者識別サービスリクエストを実行する場合の実行例について説明します。

📘
準備からの実行例と応答例
準備から話者識別サービス利用まで、一連の流れの実行例および応答例については初めてのAPI実行 - 6. 話者識別を参照してください。

実行例

以下は、話者識別サービスで HTTP(S)プロトコルを利用する cURL でのリクエスト例です。

curl -X POST https://service.mimi.fd.ai \
-H "Content-Type: audio/x-pcm;bit=16;rate=16000;channels=1" \
-H "x-mimi-srs-speaker-group-id: `<speakerGroupId>`" \
-H "x-mimi-process:srs" \
-H "Authorization: Bearer `<accessToken>`" \
--data-binary @/path/to/audio.raw

応答例

{
  "status": "recog-finished",
  "type": "srs#identification#`<speakerGroupId>`",
  "response": {
    "speaker": [
      {
        "confidence": 0.9998,
        "speaker_id": "`<speakerId>`"
      },
      {
        "confidence": 0.0002,
        "speaker_id": ""
      }
    ]
  },
  "session_id": "`<sessionId>`"
}