首页

音频

11个工具

AssemblyAI

AssemblyAI

音频

AssemblyAI 是一款面向开发者的 AI 语音转文字 API,提供业界顶级的转录精度、实时处理能力以及强大的音频智能功能,适用于任何应用场景。

freemium
ElevenLabs

ElevenLabs

音频

ElevenLabs 是领先的 AI 语音合成平台,提供超逼真的文字转语音、声音克隆和 32 种以上语言的实时语音转换功能。

freemium
Maum AI

Maum AI

音频

Maum AI(前身为MINDs Lab)是韩国领先的AI企业,提供企业级语音合成、语音识别、视觉AI和NLP解决方案,以高质量韩语语音合成技术著称。

freemium
Murf AI

Murf AI

音频

AI 语音生成器,提供 20 余种语言的 120 余款录音棚级音色,用于制作专业视频、e-learning 和演示配音

freemium
Play.ht

Play.ht

音频

Play.ht 是一个拥有 900 多种超逼真声音、可从 30 秒样本克隆声音的 AI 语音生成平台,其实时 API 广泛应用于播客、有声书、IVR 系统和多说话人对话式 AI。

freemium
Speechify

Speechify

音频

Speechify 是一款 AI 文字转语音平台,能将任意文本、PDF、文档或网页转换为 200 多种声音、60 多种语言的自然音频,帮助学生、职场人士和有阅读障碍的人更高效地获取内容。

freemium
Suno

Suno

音频

Suno 是一款 AI 音乐生成平台,使用先进的 v4 模型,通过简单的文字描述即可创作出包含人声、乐器和歌词的完整歌曲。

freemium
Typecast

Typecast

音频

Typecast 是 Neosapience 开发的韩国 AI 语音平台,提供 400 余种 AI 音色,支持情感与风格控制、语音克隆,专为内容创作者打造。

freemium
Udio

Udio

音频

Udio 是一款 AI 音乐生成平台,可根据文字提示创作包含人声的完整歌曲,以出色的音质和广泛的风格支持而著称。

freemium
Vito

Vito

音频

Return Zero旗下的Vito是韩国领先的AI语音识别平台,以业界最高的韩语STT准确率提供实时会议转录、音频文件转录和开发者API服务。

freemium
Whisper

Whisper

音频

Whisper是OpenAI开源的语音识别模型,在99种语言上提供顶尖的转录准确率,可免费在本地运行或通过OpenAI API使用。

free