Google

Gemini 3.1 Flash TTS

Google の Gemini 3.1 Flash TTS——表現力豊かなテキストtoスピーチ、30 種の声とスタイル制御。

サブスクリプションなし
クレジットは期限切れにならない
もっと学ぶ

クレジットを一度支払う-ZOOOPのすべてのモデルで使用してください。 · 必要に応じて補充してください。毎月の負担はありません。

Powered by Google's API on ZOOOP

主な特徴

30 種の声

30 種の名前付き声のライブラリ——Kore や Puck から Zephyr、Achernar まで——幅広いトーンとキャラクターをカバー。

スタイル指示

独立したスタイル指示を追加して配達を誘導——ペース、トーン、感情——言葉そのものを超えて。

Google Gemini の血統

Google の Gemini 音声モデルをベースに構築、自然で表現力豊かな出力。

1,000 文字あたり課金

テキスト長で課金、コストがスクリプトサイズに比例してスケール。

ユースケース

ナレーション&ボイスオーバー

ナレーション&ボイスオーバー

動画、解説、プレゼン用にクリアで表現力豊かなナレーションを生成。

スタイル指示の配達

スタイル指示の配達

スタイル指示を使用して、同じテキストからアップビート、穏やか、ドラマチックな読みを設定。

キャラクターの声

キャラクターの声

30 種の声から選択し、異なるキャラクターに独自の配達を付与。

会話アバターの駆動

会話アバターの駆動

声を生成し、それを Kling Avatar V2 などのアバターモデルで駆動。

eラーニング音声

eラーニング音声

複数のレッスンにわたる一貫したコースナレーションを制作。

ポッドキャスト&音声コンテンツ

ポッドキャスト&音声コンテンツ

選択した声とスタイルで話されるセグメントとイントロを生成。

適切なモデルを選択してください

正しい音声モデルを選びましょう。クレジットは ZOOOP 上のすべてのモデルで共通です。

表現力豊かな TTS、スタイル制御付きGemini 3.1 Flash TTS
ElevenLabs フラッグシップボイスオーバーMultilingual V3
多言語 TTS、QwenQwen3-TTS
低コスト、多数の声の TTSInworld TTS
会話アバターの駆動Kling Avatar V2
効果音と環境音Sound Effects V2

使い方

01

このページまたは音声ツールから Gemini 3.1 Flash TTS を開く。

02

テキストを貼り付け、声を選択。

03

必要に応じてスタイル指示で配達を誘導。

04

生成後、ダウンロードまたはキャンバスに送信。

ディープダイブ

Gemini 3.1 Flash TTS が得意なこと、そして苦手なこと

Gemini 3.1 Flash TTS は Google の表現力豊かなテキストtoスピーチモデル、Gemini 音声の血統をベースに構築。2 つの定義的な強みは 30 種の名前付き声のライブラリ——Kore、Puck、Zephyr、Achernar など、幅広いトーンとキャラクターをカバー——と、配達を指示する独立したスタイル指示フィールド。同じスクリプトは指示に応じてアップビート、穏やか、ドラマチックに読み分け可能、声を選ぶだけより細かい制御を提供。

価格は 1,000 文字あたり、コストがスクリプト長に比例してスケール——短いボイスオーバーから完全なナレーションまで予測可能。会話アバター作業との自然な組み合わせ:ここで声を生成し、Kling Avatar V2 などのモデルで駆動。

ZOOOP の音声モデル群での位置:Multilingual V3 は深い声制御を持つ ElevenLabs のフラッグシップ;Qwen3-TTSInworld TTS は多言語カバレッジとコストパフォーマンスでリード。Gemini 3.1 Flash TTS のスイートスポットは Google の声で表現力豊か、スタイル指示のナレーション。

判断の目安:明示的なスタイル制御で表現力豊かなナレーションを望むときは Gemini 3.1 Flash TTS をデフォルトに、ElevenLabs の声ライブラリには Multilingual V3 に、幅広い多言語カバレッジには Inworld/Qwen に切替。

よくある質問

Gemini 3.1 Flash TTS には何種類の声がある?+

幅広いトーンとキャラクターをカバーする 30 種の名前付き声。

スタイル指示とは?+

配達を指示する独立したフィールド——ペース、トーン、感情——同じテキストをアップビート、穏やか、ドラマチックに読み分け可能。

どう課金される?+

テキスト 1,000 文字あたり、コストはスクリプト長に比例。

ElevenLabs Multilingual V3 とどう違う?+

両方とも高品質 TTS。Gemini 3.1 Flash TTS は Google の声とスタイル指示を提供;Multilingual V3 は深い声制御を持つ ElevenLabs のフラッグシップ。声の好みとワークフローで選択。

他のモデル