概要

mimi について

mimi は音声情報に特化したクラウド API プラットフォームです。mimi API として以下のような機能を提供しており、機能によっては無料でお試しいただくことが可能です。

クラウド API サービス

サービス名	概要
音声認識 mimi ASR	mimi の音声認識サービスです。会話などの音声を mimi に渡すことでテキストへ変換することができます。
言語識別 mimi LID	mimi の言語識別サービスです。会話などの音声データにどのような言語が含まれているか識別することができます。
音声合成 mimi TTS	mimi の音声合成サービスです。言語とテキストを指定することで、指定言語で音声を作成することができます。
機械翻訳 mimi TRA	mimi の翻訳サービスです。テキストと翻訳したい言語を指定することで、テキストの翻訳を行うことができます。
話者識別 mimi SRS	mimi の話者識別サービスです。話者とその音声を事前学習させることで音声データをもとに「誰が話しているか」を特定することができます。
態度認識 mimi AIR	mimi の態度認識サービスです。音声から疑問、受諾、非受諾、考え中を推定することができます。
感情認識 mimi EMO	mimi の感情認識サービスです。音声から感情を推定します。

クラウド API サービス以外の提供機能

機能名	概要
mimi XFE	マルチマイクを使って集音された音を処理するライブラリです。音声の発話区間抽出、音源定位、特定方向の音声強調、エコーキャンセル、ノイズ抑制などの機能を提供しています。これらの機能を利用することで、高精度の音声認識に必要なクリアな音声を取得できます。すでにお手元に Tumbler をお持ちの方はこちらを参照ください。お客様の個別環境での利用をご希望の方は CONTACT よりお問い合わせください。

機能名

概要

mimi XFE

マルチマイクを使って集音された音を処理するライブラリです。音声の発話区間抽出、音源定位、特定方向の音声強調、エコーキャンセル、ノイズ抑制などの機能を提供しています。これらの機能を利用することで、高精度の音声認識に必要なクリアな音声を取得できます。

すでにお手元に Tumbler をお持ちの方はこちらを参照ください。
お客様の個別環境での利用をご希望の方は CONTACT よりお問い合わせください。

本ガイドについて

本ガイドでは mimi API Console の利用方法や、リファレンスについて紹介しています。開発経験のない方や、初めて mimi を利用する方は、スタートガイドで mimi API の利用方法を学習することをおすすめします。さらに mimi について学習したい方は開発者向けのガイドをご覧ください。

トピック	対象	トピック詳細
スタートガイド	初めての方向け	mimi API の利用方法サンプルコードの紹介
ユーザーガイド	初めての方・開発者向け	mimi の基本概念 API Console 、mimi API の利用方法 API リファレンス
各機能詳細	開発者向け	mimi ASR、LID、SRS 、TTS 、TRA の機能仕様
ヘルプ	全対象	よくある質問