mimi について

mimi は音声情報に特化したクラウド API プラットフォームです。mimi API として以下のような機能を提供しており、機能によっては無料でお試しいただくことが可能です。

クラウド API サービス

サービス名                  

概要

mimi ASR

mimi の音声認識サービスです。会話などの音声を mimi に渡すことでテキストへ変換することができます。

活用方法・導入事例

mimi LID

mimi の言語識別サービスです。会話などの音声データにどのような言語が含まれているか識別することができます。

活用方法・導入事例

mimi TTS

mimi の音声合成サービスです。言語とテキストを指定することで、指定言語で音声を作成することができます。

活用方法・導入事例

mimi TRA

mimi の翻訳サービスです。テキストと翻訳したい言語を指定することで、テキストの翻訳を行うことができます。

活用方法・導入事例

mimi SRS

mimi の話者識別サービスです。話者とその音声を事前学習させることで音声データをもとに「誰が話しているか」を特定することができます。

活用方法・導入事例

mimi AIR

mimi の態度認識サービスです。音声から疑問、受諾、非受諾、考え中を推定することができます。

活用方法・導入事例

mimi EMO

mimi の感情認識サービスです。音声から感情を推定します。

活用方法・導入事例

クラウド API サービス以外の提供機能

機能名

概要

mimi XFE

マルチマイクを使って集音された音を処理するライブラリです。音声の発話区間抽出、音源定位、特定方向の音声強調、エコーキャンセル、ノイズ抑制などの機能を提供しています。これらの機能を利用することで、高精度の音声認識に必要なクリアな音声を取得できます。

すでにお手元に Tumbler をお持ちの方はこちらを参照ください。
お客様の個別環境での利用をご希望の方は CONTACT よりお問い合わせください。

本ガイドについて

本ガイドでは mimi API Console の利用方法や、リファレンスについて紹介しています。開発経験のない方や、初めて mimi を利用する方は、スタートガイドで mimi API の利用方法を学習することをおすすめします。さらに mimi について学習したい方は開発者向けのガイドをご覧ください。

トピック

対象

トピック詳細

スタートガイド

初めての方向け

  • mimi API の利用方法
  • サンプルコードの紹介

ユーザーガイド

初めての方・開発者向け

  • mimi の基本概念
  • API Console 、mimi API の利用方法
  • API リファレンス

各機能詳細

開発者向け

  • mimi ASR、LID、SRS 、TTS 、TRA の機能仕様

ヘルプ

全対象

  • よくある質問

Did this page help you?