Google

Gemini 3.1 Flash TTS

Google의 Gemini 3.1 Flash TTS — 30개의 보이스와 스타일 제어가 포함된 표현력 있는 텍스트-음성 변환.

구독 없음
크레딧이 만료되지 않음
자세히 보기

크레딧에 대해 한 번 지불하십시오. ZOOOP의 모든 모델에서 크레딧을 사용하십시오. · 필요할 때 보충하고 월별 화상을 입지 마십시오.

Powered by Google's API on ZOOOP

주요 기능

30개의 보이스

Kore와 Puck부터 Zephyr와 Achernar까지 — 다양한 톤과 캐릭터를 커버하는 30개의 이름 있는 보이스 라이브리.

스타일 지시

단어 그 이상으로 전달 방향을 잡기 위해 별도의 스타일 지시를 추가하세요 — 속도, 톤, 감정.

Google Gemini 계보

자연스럽고 표현력 있는 출력을 위한 Google의 Gemini 음성 모델을 기반으로 구축.

1,000자당 가격

텍스트 길이에 따라 가격이 책정되어 비용이 스크립트 크기에 따라 깔끔하게 확장됩니다.

사용 사례

내레이션과 보이스오버

내레이션과 보이스오버

비디오, 설명 콘텐츠, 프레젠테이션을 위한 명확하고 표현력 있는 내레이션을 생성하세요.

스타일 기반 전달

스타일 기반 전달

같은 텍스트에서 밝고, 차분하거나, 극적인 읽기를 설정하기 위해 스타일 지시를 사용하세요.

캐릭터 음성

캐릭터 음성

30개의 보이스에서 선택해 각 캐릭터에게 고유한 전달 방식을 부여하세요.

토킹 아바타 구동

토킹 아바타 구동

음성을 생성한 뒤, Kling Avatar V2 같은 아바타 모델로 구동하세요.

이러닝 오디오

이러닝 오디오

여러 강의에 걸쳐 일관된 코스 내레이션을 생산하세요.

팟캐스트와 오디오 콘텐츠

팟캐스트와 오디오 콘텐츠

선택한 보이스와 스타일로 구어 세그먼트와 인트로를 생성하세요.

올바른 모델 선택

적절한 음성 모델을 선택하세요. ZOOOP 어디서든 크레딧이 통합니다.

스타일 제어가 포함된 표현력 있는 TTSGemini 3.1 Flash TTS
ElevenLabs 플래그십 보이스오버Multilingual V3
다국어 TTS, QwenQwen3-TTS
저렴하고 보이스가 많은 TTSInworld TTS
토킹 아바타 구동Kling Avatar V2
음향 효과와 앰비언스Sound Effects V2

사용방법

01

이 페이지에서 Gemini 3.1 Flash TTS를 열거나 오디오 도구에서 선택하세요.

02

텍스트를 붙여넣고 보이스를 선택하세요.

03

필요한 경우 전달 방향을 잡기 위해 스타일 지시를 추가하세요.

04

생성한 뒤 다운로드하거나 오디오를 캔버스로 보내세요.'

딥 다이브

Gemini 3.1 Flash TTS가 잘하는 것 — 그리고 아닌 것

Gemini 3.1 Flash TTS는 Gemini 음성 계보를 기반으로 구축된 Google의 표현력 있는 텍스트-음성 변환 모델입니다. 두 가지 정의하는 강점은 다양한 톤과 캐릭터를 커버하는 30개의 이름 있는 보이스 — Kore, Puck, Zephyr, Achernar 등 — 와 전달 방향을 잡을 수 있는 별도의 스타일 지시 필드입니다. 같은 스크립트가 지시에 따라 밝게, 차분하게, 또는 극적으로 읽힐 수 있어, 보이스만 선택하는 것보다 더 미세한 제어를 제공합니다.

가격은 1,000자당으로, 비용이 스크립트 길이에 따라 깔끔하게 확장됩니다 — 짧은 보이스오버부터 전체 내레이션까지 모든 것에 대해 예측 가능합니다. 토킹 아바타 작업을 위한 자연스러운 짝입니다: 여기서 음성을 생성한 뒤, Kling Avatar V2 같은 모델로 구동하세요.

ZOOOP 음성 모델에서의 위치: Multilingual V3는 깊은 음성 제어를 가진 ElevenLabs의 플래그십; Qwen3-TTSInworld TTS는 다국어 커버리지와 가치에서 선두. Gemini 3.1 Flash TTS의 강점은 Google의 보이스로 표현력 있고 스타일 기반 내레이션입니다.

합리적인 판단 기준: 명시적 스타일 제어로 표현력 있는 내레이션을 원할 때 Gemini 3.1 Flash TTS를 기본으로 쓰고, ElevenLabs의 보이스 라이브리에는 Multilingual V3로, 광범위한 다국어 커버리지에는 Inworld/Qwen으로 전환하세요.

자주 묻는 질문

Gemini 3.1 Flash TTS에는 보이스가 몇 개 있나요?+

다양한 톤과 캐릭터를 커버하는 30개의 이름 있는 보이스.

스타일 지시란 무엇인가요?+

전달 방향을 잡기 위한 별도 필드 — 속도, 톤, 감정 — 같은 텍스트를 밝게, 차분하게, 또는 극적으로 읽힐 수 있습니다.

가격은 어떻게 되나요?+

텍스트 1,000자당, 비용이 스크립트 길이에 따라 확장됩니다.

ElevenLabs Multilingual V3와 어떻게 비교되나요?+

둘 다 고품질 TTS입니다. Gemini 3.1 Flash TTS는 스타일 지시가 포함된 Google의 보이스를 제공합니다; Multilingual V3는 깊은 음성 제어를 가진 ElevenLabs의 플래그십입니다. 보이스 선호도와 워크플로에 따라 선택하세요.

더 많은 모델