mimi について
mimi は音声情報に特化したクラウド API プラットフォームです。mimi API として以下のような機能を提供しており、機能によっては無料でお試しいただくことが可能です。
クラウド API サービス
サービス名 | 概要 |
---|---|
音声認識 mimi ASR | mimi の音声認識サービスです。会話などの音声を mimi に渡すことでテキストへ変換することができます。 |
言語識別 mimi LID | mimi の言語識別サービスです。会話などの音声データにどのような言語が含まれているか識別することができます。 |
音声合成 mimi TTS | mimi の音声合成サービスです。言語とテキストを指定することで、指定言語で音声を作成することができます。 |
機械翻訳 mimi TRA | mimi の翻訳サービスです。テキストと翻訳したい言語を指定することで、テキストの翻訳を行うことができます。 |
話者識別 mimi SRS | mimi の話者識別サービスです。話者とその音声を事前学習させることで音声データをもとに「誰が話しているか」を特定することができます。 |
態度認識 mimi AIR | mimi の態度認識サービスです。音声から疑問、受諾、非受諾、考え中を推定することができます。 |
感情認識 mimi EMO | mimi の感情認識サービスです。音声から感情を推定します。 |
クラウド API サービス以外の提供機能
本ガイドについて
本ガイドでは mimi API Console の利用方法や、リファレンスについて紹介しています。開発経験のない方や、初めて mimi を利用する方は、スタートガイドで mimi API の利用方法を学習することをおすすめします。さらに mimi について学習したい方は開発者向けのガイドをご覧ください。
トピック | 対象 | トピック詳細 |
---|---|---|
スタートガイド | 初めての方向け | - mimi API の利用方法 - サンプルコードの紹介 |
ユーザーガイド | 初めての方・開発者向け | - mimi の基本概念 - API Console 、mimi API の利用方法 - API リファレンス |
各機能詳細 | 開発者向け | - mimi ASR、LID、SRS 、TTS 、TRA の機能仕様 |
ヘルプ | 全対象 | - よくある質問 |
Updated over 1 year ago