
내레이션과 보이스오버
비디오, 설명 콘텐츠, 프레젠테이션을 위한 명확하고 표현력 있는 내레이션을 생성하세요.
Google의 Gemini 3.1 Flash TTS — 30개의 보이스와 스타일 제어가 포함된 표현력 있는 텍스트-음성 변환.
크레딧에 대해 한 번 지불하십시오. ZOOOP의 모든 모델에서 크레딧을 사용하십시오. · 필요할 때 보충하고 월별 화상을 입지 마십시오.
Powered by Google's API on ZOOOP
Kore와 Puck부터 Zephyr와 Achernar까지 — 다양한 톤과 캐릭터를 커버하는 30개의 이름 있는 보이스 라이브리.
단어 그 이상으로 전달 방향을 잡기 위해 별도의 스타일 지시를 추가하세요 — 속도, 톤, 감정.
자연스럽고 표현력 있는 출력을 위한 Google의 Gemini 음성 모델을 기반으로 구축.
텍스트 길이에 따라 가격이 책정되어 비용이 스크립트 크기에 따라 깔끔하게 확장됩니다.

비디오, 설명 콘텐츠, 프레젠테이션을 위한 명확하고 표현력 있는 내레이션을 생성하세요.

같은 텍스트에서 밝고, 차분하거나, 극적인 읽기를 설정하기 위해 스타일 지시를 사용하세요.

30개의 보이스에서 선택해 각 캐릭터에게 고유한 전달 방식을 부여하세요.

음성을 생성한 뒤, Kling Avatar V2 같은 아바타 모델로 구동하세요.

여러 강의에 걸쳐 일관된 코스 내레이션을 생산하세요.

선택한 보이스와 스타일로 구어 세그먼트와 인트로를 생성하세요.
적절한 음성 모델을 선택하세요. ZOOOP 어디서든 크레딧이 통합니다.
이 페이지에서 Gemini 3.1 Flash TTS를 열거나 오디오 도구에서 선택하세요.
텍스트를 붙여넣고 보이스를 선택하세요.
필요한 경우 전달 방향을 잡기 위해 스타일 지시를 추가하세요.
생성한 뒤 다운로드하거나 오디오를 캔버스로 보내세요.'
Gemini 3.1 Flash TTS는 Gemini 음성 계보를 기반으로 구축된 Google의 표현력 있는 텍스트-음성 변환 모델입니다. 두 가지 정의하는 강점은 다양한 톤과 캐릭터를 커버하는 30개의 이름 있는 보이스 — Kore, Puck, Zephyr, Achernar 등 — 와 전달 방향을 잡을 수 있는 별도의 스타일 지시 필드입니다. 같은 스크립트가 지시에 따라 밝게, 차분하게, 또는 극적으로 읽힐 수 있어, 보이스만 선택하는 것보다 더 미세한 제어를 제공합니다.
가격은 1,000자당으로, 비용이 스크립트 길이에 따라 깔끔하게 확장됩니다 — 짧은 보이스오버부터 전체 내레이션까지 모든 것에 대해 예측 가능합니다. 토킹 아바타 작업을 위한 자연스러운 짝입니다: 여기서 음성을 생성한 뒤, Kling Avatar V2 같은 모델로 구동하세요.
ZOOOP 음성 모델에서의 위치: Multilingual V3는 깊은 음성 제어를 가진 ElevenLabs의 플래그십; Qwen3-TTS와 Inworld TTS는 다국어 커버리지와 가치에서 선두. Gemini 3.1 Flash TTS의 강점은 Google의 보이스로 표현력 있고 스타일 기반 내레이션입니다.
합리적인 판단 기준: 명시적 스타일 제어로 표현력 있는 내레이션을 원할 때 Gemini 3.1 Flash TTS를 기본으로 쓰고, ElevenLabs의 보이스 라이브리에는 Multilingual V3로, 광범위한 다국어 커버리지에는 Inworld/Qwen으로 전환하세요.
다양한 톤과 캐릭터를 커버하는 30개의 이름 있는 보이스.
전달 방향을 잡기 위한 별도 필드 — 속도, 톤, 감정 — 같은 텍스트를 밝게, 차분하게, 또는 극적으로 읽힐 수 있습니다.
텍스트 1,000자당, 비용이 스크립트 길이에 따라 확장됩니다.
둘 다 고품질 TTS입니다. Gemini 3.1 Flash TTS는 스타일 지시가 포함된 Google의 보이스를 제공합니다; Multilingual V3는 깊은 음성 제어를 가진 ElevenLabs의 플래그십입니다. 보이스 선호도와 워크플로에 따라 선택하세요.
Prompt*
Style Instructions
Voice*