Quantas vozes tem o Gemini 3.1 Flash TTS?

30 vozes com nome cobrindo uma vasta gama de tons e personagens.

O que são instruções de estilo?

Um campo separado para orientar a entrega — ritmo, tom, emoção — para que o mesmo texto possa ser lido de forma animada, calma ou dramática.

Por 1.000 caracteres de texto, os custos escalam com o comprimento do guião.

Como se compara ao ElevenLabs Multilingual V3?

Ambos são TTS de alta qualidade. O Gemini 3.1 Flash TTS oferece as vozes da Google com instruções de estilo; o Multilingual V3 é o insignia da ElevenLabs com controlo profundo de voz. Escolha pela preferência de voz e workflow.

Gemini 3.1 Flash TTS no ZOOOP — Síntese de Voz Expressiva

O que o Gemini 3.1 Flash TTS faz bem — e o que não faz

O Gemini 3.1 Flash TTS é o modelo de síntese de voz expressiva da Google, construído sobre a linhagem de voz Gemini. As suas duas forças distintivas são uma biblioteca de 30 vozes com nome — Kore, Puck, Zephyr, Achernar e mais, cobrindo uma vasta gama de tons e personagens — e um campo de instrução de estilo separado que lhe permite orientar a entrega. O mesmo guião pode ser lido de forma animada, calma ou dramática dependendo da instrução, o que oferece controlo mais fino do que escolher apenas uma voz.

A faturação é por 1.000 caracteres, os custos escalam proporcionalmente ao comprimento do guião — previsível para tudo, desde uma curta voz over até uma narração completa. É um emparelhamento natural para trabalho de avatar falante: gere a voz aqui, depois conduza um modelo como o Kling Avatar V2 com ela.

Entre os modelos de voz do ZOOOP: o Multilingual V3 é o insignia da ElevenLabs com controlo profundo de voz; o Qwen3-TTS e o Inworld TTS lideram em cobertura multilingue e valor. O ponto forte do Gemini 3.1 Flash TTS é a narração expressiva e orientada por estilo com as vozes da Google.

Um modelo mental razoável: use o Gemini 3.1 Flash TTS por predefinição quando quer narração expressiva com controlo explícito de estilo, e mude para o Multilingual V3 para a biblioteca de vozes da ElevenLabs ou Inworld/Qwen para ampla cobertura multilingue.

Gemini 3.1 Flash TTS

Gemini 3.1 Flash TTS

Principais características

30 vozes

Instruções de estilo

Linhagem Google Gemini

Faturação por 1.000 caracteres

Casos de uso

Narração e voz over

Entrega orientada por estilo

Vozes de personagens

Conduzir um avatar falante

Áudio e-learning

Podcast e conteúdo áudio

Escolha o modelo certo

Como usar

Mergulho profundo

O que o Gemini 3.1 Flash TTS faz bem — e o que não faz

Perguntas frequentes

Mais modelos

Gemini 3.1 Flash TTS