Gemini 3.1 Flash TTS には何種類の声がある？

幅広いトーンとキャラクターをカバーする 30 種の名前付き声。

スタイル指示とは？

配達を指示する独立したフィールド——ペース、トーン、感情——同じテキストをアップビート、穏やか、ドラマチックに読み分け可能。

どう課金される？

テキスト 1,000 文字あたり、コストはスクリプト長に比例。

ElevenLabs Multilingual V3 とどう違う？

両方とも高品質 TTS。Gemini 3.1 Flash TTS は Google の声とスタイル指示を提供；Multilingual V3 は深い声制御を持つ ElevenLabs のフラッグシップ。声の好みとワークフローで選択。

ZOOOP の Gemini 3.1 Flash TTS — 表現力豊かなテキストtoスピーチ

Gemini 3.1 Flash TTS

Google の Gemini 3.1 Flash TTS——表現力豊かなテキストtoスピーチ、30 種の声とスタイル制御。

サブスクリプションなし

クレジットは期限切れにならない

もっと学ぶ

クレジットを一度支払う-ZOOOPのすべてのモデルで使用してください。 · 必要に応じて補充してください。毎月の負担はありません。

Gemini 3.1 Flash TTS が得意なこと、そして苦手なこと

Gemini 3.1 Flash TTS は Google の表現力豊かなテキストtoスピーチモデル、Gemini 音声の血統をベースに構築。2 つの定義的な強みは 30 種の名前付き声のライブラリ——Kore、Puck、Zephyr、Achernar など、幅広いトーンとキャラクターをカバー——と、配達を指示する独立したスタイル指示フィールド。同じスクリプトは指示に応じてアップビート、穏やか、ドラマチックに読み分け可能、声を選ぶだけより細かい制御を提供。

価格は 1,000 文字あたり、コストがスクリプト長に比例してスケール——短いボイスオーバーから完全なナレーションまで予測可能。会話アバター作業との自然な組み合わせ：ここで声を生成し、Kling Avatar V2 などのモデルで駆動。

ZOOOP の音声モデル群での位置：Multilingual V3 は深い声制御を持つ ElevenLabs のフラッグシップ；Qwen3-TTS と Inworld TTS は多言語カバレッジとコストパフォーマンスでリード。Gemini 3.1 Flash TTS のスイートスポットは Google の声で表現力豊か、スタイル指示のナレーション。

判断の目安：明示的なスタイル制御で表現力豊かなナレーションを望むときは Gemini 3.1 Flash TTS をデフォルトに、ElevenLabs の声ライブラリには Multilingual V3 に、幅広い多言語カバレッジには Inworld/Qwen に切替。

Gemini 3.1 Flash TTS

Gemini 3.1 Flash TTS

主な特徴

30 種の声

スタイル指示

Google Gemini の血統

1,000 文字あたり課金

ユースケース

ナレーション＆ボイスオーバー

スタイル指示の配達

キャラクターの声

会話アバターの駆動

eラーニング音声

ポッドキャスト＆音声コンテンツ

適切なモデルを選択してください

使い方

ディープダイブ

Gemini 3.1 Flash TTS が得意なこと、そして苦手なこと

よくある質問

他のモデル

Gemini 3.1 Flash TTS