오디오
11개 도구
AssemblyAI
오디오AssemblyAI는 개발자 중심의 AI 음성-텍스트 변환 API로, 업계 최고 수준의 전사 정확도, 실시간 처리, 강력한 오디오 인텔리전스 기능을 제공합니다.
ElevenLabs
오디오32개 이상의 언어로 초실감적인 텍스트-음성, 음성 복제 및 실시간 음성 변환을 제공하는 선도적인 AI 음성 합성 플랫폼.
마음AI
오디오마음AI(구 마인즈랩)는 최고 수준의 한국어 음성 합성, 음성 인식, 비전 AI, NLP 솔루션을 제공하는 한국 대표 AI 기업입니다.
Murf AI
오디오비디오, e-러닝 콘텐츠, 프레젠테이션을 위한 전문 보이스오버 제작을 위해 20개 이상의 언어로 120개 이상의 스튜디오 품질 음성을 갖춘 AI 음성 생성기.
Play.ht
오디오Play.ht는 900개 이상의 초현실적 음성, 30초 샘플로 음성 복제, 팟캐스트·오디오북·IVR 시스템·다화자 대화형 AI에 사용되는 실시간 API를 제공하는 AI 음성 생성 플랫폼입니다.
Speechify
오디오Speechify는 모든 텍스트, PDF, 문서, 웹페이지를 200개 이상의 목소리와 60개 이상의 언어로 자연스러운 오디오로 변환하는 AI 텍스트 음성 변환 플랫폼으로, 학생, 직장인, 난독증 있는 사람들이 콘텐츠를 더 빠르게 소화할 수 있도록 돕습니다.
Suno
오디오Suno는 최신 v4 모델을 사용하여 간단한 텍스트 프롬프트만으로 보컬, 악기, 가사가 포함된 완성된 노래를 생성하는 AI 음악 플랫폼입니다.
타입캐스트
오디오타입캐스트는 네오사피엔스가 개발한 한국 최고의 AI 음성 플랫폼으로, 400개 이상의 AI 음성과 감정·스타일 제어, 음성 클로닝 기능을 제공합니다.
Udio
오디오Udio는 텍스트 프롬프트로 보컬이 포함된 완성된 곡을 생성하는 AI 음악 플랫폼으로, 뛰어난 오디오 품질과 다양한 장르 지원으로 주목받고 있습니다.
비토(VITO)
오디오리턴제로의 비토(VITO)는 업계 최고 수준의 한국어 STT 정확도로 실시간 회의 전사, 오디오 파일 전사, 개발자 API를 제공하는 한국 대표 AI 음성 인식 플랫폼입니다.
Whisper
오디오Whisper는 OpenAI의 오픈소스 음성 인식 모델로, 99개 언어에서 최첨단 전사 정확도를 제공하며 로컬 실행 또는 OpenAI API를 통해 무료로 이용할 수 있습니다.