オーディオ
11件のツール
AssemblyAI
オーディオAssemblyAIは開発者向けのAI音声テキスト変換APIで、業界最高水準の文字起こし精度、リアルタイム処理、強力な音声インテリジェンス機能をあらゆるアプリケーションに提供します。
ElevenLabs
オーディオ32以上の言語で超リアルなテキスト→音声、音声クローニング、リアルタイム音声変換を提供する主要AIボイス合成プラットフォーム。
Maum AI
オーディオMaum AI(旧MINDs Lab)は、業界最高水準の韓国語音声合成・音声認識・ビジョンAI・NLPソリューションを提供する韓国のエンタープライズAI企業です。
Murf AI
オーディオビデオ、eラーニングコンテンツ、プレゼンテーション向けのプロ品質ボイスオーバー制作のための20以上の言語、120以上のスタジオ品質ボイスを持つAIボイスジェネレーター。
Play.ht
オーディオPlay.htは900以上の超リアルな音声、30秒のサンプルからの音声クローニング、ポッドキャスト・オーディオブック・IVRシステム・マルチスピーカー会話AIに使われるリアルタイムAPIを提供するAI音声生成プラットフォームです。
Speechify
オーディオSpeechifyは任意のテキスト、PDF、文書、ウェブページを200以上の声と60以上の言語で自然な音声に変換するAIテキスト読み上げプラットフォームで、学生、社会人、難読症の方がコンテンツをより速く消化するのを助けます。
Suno
オーディオSunoは最新のv4モデルを使用して、シンプルなテキストプロンプトからボーカル、楽器、歌詞を含む完全な楽曲を生成するAI音楽生成プラットフォームです。
Typecast
オーディオTypecastはNeosapience社が開発した韓国発のAI音声プラットフォームで、400以上のAI音声と感情・スタイル制御、音声クローニング機能を提供します。
Udio
オーディオUdioはテキストプロンプトからボーカル入りの完全な楽曲を生成するAI音楽プラットフォームで、卓越した音質と幅広いジャンルサポートで注目されています。
Vito
オーディオReturn ZeroのVitoは、業界最高水準の韓国語STT精度でリアルタイム会議文字起こし・音声ファイル文字起こし・開発者APIを提供する韓国トップのAI音声認識プラットフォームです。
Whisper
オーディオWhisperはOpenAIのオープンソース音声認識モデルで、99言語にわたる最先端の文字起こし精度を誇り、ローカル実行またはOpenAI APIを通じて無料で利用可能です。