Google

Gemini 3.1 Flash TTS

Le Gemini 3.1 Flash TTS de Google — synthèse vocale expressive avec 30 voix et contrôle du style.

Pas d'abonnement
Les crédits n'expirent jamais
En savoir plus

Payez une fois pour les crédits - utilisez-les sur tous les modèles de ZOOOP. · Rechargez quand vous en avez besoin, pas de brûlure mensuelle.

Powered by Google's API on ZOOOP

Caractéristiques clés

30 voix

Une bibliothèque de 30 voix nommées — de Kore et Puck à Zephyr et Achernar — couvrant un large éventail de tons et de personnages.

Instructions de style

Ajoutez une instruction de style séparée pour orienter la livraison — rythme, ton et émotion — au-delà des mots eux-mêmes.

Lignée Google Gemini

Construit sur les modèles vocaux Gemini de Google pour une sortie naturelle et expressive.

Facturation par tranche de 1 000 caractères

Facturé par longueur de texte, le coût augmente proportionnellement à la taille du script.

Cas d'utilisation

Narration et voix off

Narration et voix off

Générez une narration claire et expressive pour les vidéos, explications et présentations.

Livraison dirigée par le style

Livraison dirigée par le style

Utilisez les instructions de style pour définir une lecture dynamique, calme ou dramatique à partir du même texte.

Voix de personnages

Voix de personnages

Choisissez parmi 30 voix pour donner à différents personnages des livraisons distinctes.

Piloter un avatar parlant

Piloter un avatar parlant

Générez la voix, puis pilotez un modèle d'avatar comme Kling Avatar V2 avec.

Audio e-learning

Audio e-learning

Produisez une narration de cours cohérente sur de nombreuses leçons.

Podcast et contenu audio

Podcast et contenu audio

Générez des segments parlés et des intros avec une voix et un style choisis.

Choisissez le bon modèle

Choisissez le bon modèle vocal. Vos crédits fonctionnent partout sur ZOOOP.

TTS expressif avec contrôle du styleGemini 3.1 Flash TTS
Voix off phare ElevenLabsMultilingual V3
TTS multilingue, QwenQwen3-TTS
TTS pas cher, nombreuses voixInworld TTS
Piloter un avatar parlantKling Avatar V2
Effets sonores et ambianceSound Effects V2

Comment utiliser

01

Ouvrez Gemini 3.1 Flash TTS depuis cette page ou sélectionnez-le dans les outils Audio.

02

Collez votre texte et choisissez une voix.

03

Ajoutez une instruction de style pour orienter la livraison si nécessaire.

04

Générez, puis téléchargez ou envoyez l'audio sur votre canvas.

Plongée profonde

Ce que Gemini 3.1 Flash TTS fait bien — et ce qu'il fait moins bien

Gemini 3.1 Flash TTS est le modèle de synthèse vocale expressive de Google, construit sur la lignée vocale Gemini. Ses deux forces distinctives sont une bibliothèque de 30 voix nommées — Kore, Puck, Zephyr, Achernar et plus, couvrant un large éventail de tons et de personnages — et un champ d'instruction de style séparé qui vous permet de diriger la livraison. Le même script peut être lu de manière dynamique, calme ou dramatique selon l'instruction, ce qui offre un contrôle plus fin que le choix d'une voix seule.

La facturation est par tranche de 1 000 caractères, le coût augmente proportionnellement à la longueur du script — prévisible pour tout, d'une courte voix off à une narration complète. C'est un appariement naturel pour le travail d'avatar parlant : générez la voix ici, puis pilotez un modèle comme Kling Avatar V2 avec.

Parmi les modèles vocaux de ZOOOP : Multilingual V3 est le phare d'ElevenLabs avec un contrôle vocal approfondi ; Qwen3-TTS et Inworld TTS mènent en couverture multilingue et en valeur. Le point fort de Gemini 3.1 Flash TTS est la narration expressive et dirigée par le style avec les voix de Google.

Un modèle mental raisonnable : par défaut avec Gemini 3.1 Flash TTS quand vous voulez une narration expressive avec un contrôle explicite du style, et passez à Multilingual V3 pour la bibliothèque vocale d'ElevenLabs ou Inworld/Qwen pour une large couverture multilingue.

Questions fréquemment posées

Combien de voix possède Gemini 3.1 Flash TTS ?+

30 voix nommées couvrant un large éventail de tons et de personnages.

Que sont les instructions de style ?+

Un champ séparé pour diriger la livraison — rythme, ton, émotion — pour que le même texte puisse être lu de manière dynamique, calme ou dramatique.

Comment est-il facturé ?+

Par tranche de 1 000 caractères de texte, le coût augmente avec la longueur du script.

Comment se compare-t-il à ElevenLabs Multilingual V3 ?+

Les deux sont des TTS de haute qualité. Gemini 3.1 Flash TTS offre les voix de Google avec des instructions de style ; Multilingual V3 est le phare d'ElevenLabs avec un contrôle vocal approfondi. Choisissez selon la préférence vocale et le workflow.

Plus de modèles