話者識別を行う

🚧

話者識別は本サイト上では実行できないため、mimi API Console にログインいただき、こちら からお試しください。

話者識別サービスの利用手順についてはドキュメントの mimi API Console操作方法 - 話者識別を参照ください。

🚧

事前準備

話者識別サービスを利用するには、事前に話者グループの作成話者の登録と話者グループへの追加話者への発話データの登録(学習用音声の登録)と学習の実行) が必要です。

API 利用について、詳しくはドキュメントの 初めてのAPI実行 - 6. 話者識別 を参照ください。

📘

mimi が定義するカスタム HTTP ヘッダ

mimi が定義するカスタム HTTP ヘッダ( x-mimi- で始まるヘッダ ) に設定する値は、大文字小文字を区別しています。例えば "x-mimi-process" の値に "srs" は指定できますが、 "SRS" は指定できません。
また、同じヘッダが同一のリクエスト内で複数行指定された場合は、いずれか一つのみが有効になりますので極力1種類1行となるように指定してください。

当ページでは、話者識別サービス利用時の API についてのみ説明しています。
話者識別サービスを利用するために必要な事前準備のための API については、ドキュメント 学習のためのAPI を参考に mimi SRS API の各 API Reference を参照ください。

API 実行に必要なスコープ

HTTP / WebSocket どちらを利用するかによって必要なスコープは変わります。

https://apis.mimi.fd.ai/auth/srs/http-api-service
https://apis.mimi.fd.ai/auth/srs/websocket-api-service

実行

HTTP リクエスト実行例は本ページ右の "REQUEST" を参照ください。

応答

応答例

本ページの応答例( 画面右 "RESPONSE" で "200 - Result" を選択)を参照ください。

応答結果 JSON

各要素の型は本ページの "RESPONSE" を参照ください。
( resonse ステータス "200" をクリック)

キー

内容

status

話者識別結果のステータス。
recog-finished=話者識別処理終了 固定。

type

話者識別の型。
srs#identification に続く値は x-mimi-srs-speaker-group-id の指定によって変化する。

response

話者識別結果の配列

confidence

信頼度。大きいほど信頼度が高い。

speaker_id

話者ID

session_id

セッションID

Language