
오디오북 프로덕션
챕터와 캐릭터에 걸친 미묘한 톤 변화를 포함한 오디오북급 감정 전달의 롱폼 내레이션.
ElevenLabs의 최상위 TTS — 74개 언어, 다중 화자 대화, 이모션 태그, 오디오북급 내레이션.
크레딧에 대해 한 번 지불하십시오. ZOOOP의 모든 모델에서 크레딧을 사용하십시오. · 필요할 때 보충하고 월별 화상을 입지 마십시오.
Powered by ElevenLabs's API on ZOOOP
V3는 74개 언어를 지원합니다 — V2의 ~29개에서 대폭 확장 — 세계 인구의 대부분을 커버합니다. 같은 음성 특성이 언어 간에 유지됩니다.
새로운 Text-to-Dialogue API로 단일 렌더링에서 여러 명의 구별되는 화자가 있는 자연스러운 사실적인 대화를 생성합니다 — 언어 간 캐릭터 상호작용, 감정적 일관성 유지.
[whispering], [sad], [laughs], [shouting] 같은 인라인 태그로 읽기 방향을 지시합니다 — 스페인어의 [sad] 태그는 영어와 같은 방식으로 적용됩니다.
Aria, Roger, Sarah, Laura, Charlie, George, Callum, River, Liam, Charlotte, Alice, Matilda, Will, Jessica, Eric, Chris, Brian, Daniel, Lily, Bill 등 수백 개. 각 보이스는 74개 언어 모두에서 작동합니다.

챕터와 캐릭터에 걸친 미묘한 톤 변화를 포함한 오디오북급 감정 전달의 롱폼 내레이션.

다중 화자 Text-to-Dialogue로 감정적으로 상호작용하는 구별되는 캐릭터가 있는 전체 씬을 처리합니다 — 애니메이션, 게임, 오디오 드라마에 유용.

일관된 음성 특성으로 74개 언어의 같은 스크립트를 생성하세요. 하나의 브랜드 음성, 모든 시장, 언어별 별도 캐스팅 불필요.

핵심 용어에 강조를 둔 차분한 설명 톤 — 태그로 재녹음 없이 페이싱과 강세를 지시할 수 있습니다.

팟캐스트 광고 길이의 오디오북급 충실도 — 품질 저하 없이 기존 팟캐스트 파이프라인에 바로 넣으세요.

오디오 태그로 컨텍스트에 맞는 읽기([angry], [whispering], [tired])를 제공해 음성 캐스팅 없이 인게임 대사를 처리합니다.
작업에 맞는 TTS 모델을 선택하세요. ZOOOP 어디서든 크레딧이 통합니다.
이 페이지에서 ElevenLabs Multilingual V3를 열거나 오디오 생성기에서 선택하세요.
라이브리에서 보이스를 선택하세요 — 각 보이스는 74개 언어 모두에서 작동합니다.
대상 언어로 스크립트를 작성하세요. [whispering]이나 [sad] 같은 인라인 태그로 감정을 지시하세요.
생성하세요. 다중 화자의 경우, Text-to-Dialogue로 전환하고 보이스별 대사를 할당하세요.
ElevenLabs Multilingual V3는 다국어 TTS를 프로덕션에 쓸 수 있게 만들어준 모델입니다. TTS 역사의 대부분 동안 "다국어"는 체크박스 기능이었습니다 — 운이 좋으면 5개, 10개 언어, 비영어 옵션은 눈에 띄게 어색했습니다. V3는 74개 언어를 탑재하고 — 세계 인구의 대부분을 커버 — 비영어 읽기도 영어와 같은 감정적 충실도, 페이싱, 자연스러움을 유지합니다. 실질적 효과: 하나의 브랜드 음성으로 언어별 별도 캐스팅 없이, 그리고 항상 스며들던 브랜드에 어긋나는 현지 읽기 없이 글로벌 시장에 출시할 수 있습니다.
프로덕션 작업에 더 중요하지만 덜 주목받는 능력은 연출로서의 오디오 태그입니다. 텍스트에 직접 넣는 [whispering], [sad], [laughs], [shouting], [angry], [tired] 같은 마크는 V3가 연출 지시로 읽고 생성하는 언어에 관계없이 적용됩니다. 스페인어의 [sad] 태그는 영어와 같은 방식으로 적용되고, 일본어의 [whispering] 지시는 조용한 베이스라인이 아닌 속삭임으로 읽힙니다.
세 번째 플래그십 능력은 Text-to-Dialogue API입니다. 각자의 음성을 가진 구별되는 캐릭터의 다중 화자 대화 — 감정적 일관성으로 연속적인 상호작용으로 생성됩니다. 애니메이션 더빙, 게임 컷신, 오디오 드라마, 산출물이 독백이 아닌 캐릭터 상호작용인 콘텐츠에 유용합니다.
보이스 라이브리는 수백 개의 다국어 보이스 — Aria, Roger, Sarah, Laura, Charlie, George, Callum, River, Liam, Charlotte, Alice, Matilda, Will, Jessica, Eric, Chris, Brian, Daniel, Lily, Bill 등. 각 보이스는 74개 언어 모두에서 특성을 유지합니다.
약한 점: 초저지연 실시간 사용(200ms 미만 첫 응답의 라이브 대화 에이전트)은 MiniMax의 Speech-2.8-Turbo 같은 더 가볍고 빠른 모델이 적합합니다. 짧은 샘플에서의 음성 클로닝은 지원되지만 Chatterbox TTS나 Index TTS 2 같은 전용 모델이 특화되어 있습니다. V3의 강점은 고품질 내레이션, 다중 화자 대화, 다국어 브랜드 작업입니다.
합리적인 판단 기준: 밀리초 지연보다 품질이 중요한 내레이션/대화 작업에는 V3를 기본으로 쓰세요.
V3는 74개 언어(V2의 ~29개에서 확장)를 지원하고, 이모션/연출 오디오 태그를 도입하며, 다중 화자 씬을 위한 Text-to-Dialogue API를 탑재하고, 더 자연스러운 감정 범위를 생산합니다. V2는 여전히 강력한 베이스라인이며, V3는 새 프로젝트를 위한 업그레이드입니다.
V3는 영어, 중국어(간체+번체), 일본어, 한국어, 스페인어, 프랑스어, 독일어, 포르투갈어, 힌디어, 아랍어, 러시아어, 베트남어, 태국어, 인도네시아어, 터키어, 폴란드어, 네덜란드어, 노르웨이어, 덴마크어 등 74개 언어를 커버합니다 — 세계에서 가장 많이 사용되는 언어 대부분.
[whispering], [laughs], [sad], [angry], [shouting] 같은 텍스트에 직접 넣는 연출 마크입니다. V3는 이를 연출 지시로 읽고 생성하는 언어에 관계없이 감정을 적용합니다. 스페인어의 [sad] 태그는 영어와 같은 방식으로 적용됩니다.
네 — Text-to-Dialogue API는 화자와 언어 전반에 걸친 감정적 일관성으로 자연스러운 다중 화자 대화를 생성합니다. 오디오 드라마, 애니메이션 더빙, 게임, 캐릭터 상호작용이 있는 콘텐츠에 유용합니다.
V3는 언어 커버리지(74개 언어, 어떤 경쟁자보다 많음)와 연출(오디오 태그가 교차 언어로 작동)에서 선두입니다. 초저지연 실시간 사용에는 Speech-2.8-Turbo 같은 더 가볍고 빠른 모델이 적합합니다. 풀 오디오북/드라마 프로덕션에는 V3가 현재 품질 선두입니다.
Text*
Voice*
Stability*