mimi について

mimi は音声情報に特化したクラウド API プラットフォームです。mimi API として以下のような機能を提供しており、機能によっては無料でお試しいただくことが可能です。

クラウド API サービス

サービス名                  概要
音声認識
mimi ASR
mimi の音声認識サービスです。会話などの音声を mimi に渡すことでテキストへ変換することができます。
言語識別
mimi LID
mimi の言語識別サービスです。会話などの音声データにどのような言語が含まれているか識別することができます。
音声合成
mimi TTS
mimi の音声合成サービスです。言語とテキストを指定することで、指定言語で音声を作成することができます。
機械翻訳
mimi TRA
mimi の翻訳サービスです。テキストと翻訳したい言語を指定することで、テキストの翻訳を行うことができます。
話者識別
mimi SRS
mimi の話者識別サービスです。話者とその音声を事前学習させることで音声データをもとに「誰が話しているか」を特定することができます。
態度認識
mimi AIR
mimi の態度認識サービスです。音声から疑問、受諾、非受諾、考え中を推定することができます。
感情認識
mimi EMO
mimi の感情認識サービスです。音声から感情を推定します。

クラウド API サービス以外の提供機能

機能名概要
mimi XFEマルチマイクを使って集音された音を処理するライブラリです。音声の発話区間抽出、音源定位、特定方向の音声強調、エコーキャンセル、ノイズ抑制などの機能を提供しています。これらの機能を利用することで、高精度の音声認識に必要なクリアな音声を取得できます。

すでにお手元に Tumbler をお持ちの方はこちらを参照ください。
お客様の個別環境での利用をご希望の方は CONTACT よりお問い合わせください。

本ガイドについて

本ガイドでは mimi API Console の利用方法や、リファレンスについて紹介しています。開発経験のない方や、初めて mimi を利用する方は、スタートガイドで mimi API の利用方法を学習することをおすすめします。さらに mimi について学習したい方は開発者向けのガイドをご覧ください。

トピック対象トピック詳細
スタートガイド初めての方向け- mimi API の利用方法
- サンプルコードの紹介
ユーザーガイド初めての方・開発者向け- mimi の基本概念
- API Console 、mimi API の利用方法
- API リファレンス
各機能詳細開発者向け- mimi ASR、LID、SRS 、TTS 、TRA の機能仕様
ヘルプ全対象- よくある質問