
キャラクター駆動ショート
参照ショットで主人公を一度タグ付けすると、Seedance はシーケンスの各カットで顔、髪、衣装を同一に維持。
ByteDance のフラッグシップマルチモーダル動画モデル——テキスト、画像、音声、動画参照入力を一括処理。
クレジットを一度支払う-ZOOOPのすべてのモデルで使用してください。 · 必要に応じて補充してください。毎月の負担はありません。
Powered by ByteDance's API on ZOOOP
単一アーキテクチャが同期音声と動画を 1 パスで生成——対話、環境音、ビート認識音楽、後同期不要。最大 3 つの動画クリップ、9 枚の画像、3 つの音声クリップを組合せ参照入力としてサポート。
各参照画像を特定のキャラクター、小道具、ロケーションとしてタグ付け。Seedance は各被写体の視覚的一貫性をカット間で維持、同じ俳優が同じ衣装で各ショットに登場。
動画クリップをモーション参照として提供し、Seedance がその振付をキャラクター画像に転送——ダンス、スポーツアクション、スタイライズドカメラワークに有効。
ネイティブ出力最大 1080p、16:9、9:16、4:3、3:4、21:9、1:1 対応。シネマティック 21:9 と縦型 9:16 が同じプロンプトから出荷、クロップ不要。

参照ショットで主人公を一度タグ付けすると、Seedance はシーケンスの各カットで顔、髪、衣装を同一に維持。

プロダクト静止画+スクリプト音声クリップを投入し、モデルがライティング、モーション、ボイスオーバービートがすべて同期する動画を生成。

ビート認識同期により、ビジュアルがダウンビートでカット。15 秒音声クリップを投入すると、モデルがカメラモーションを編集してマッチ。

モーション参照動画で静的ストーリーボードパネルをアニメ化——プレビズの依頼より高速。

ロールタグで 1 つのプロンプトにショットを配列。他のモデルが強制する手動カット&ステッチを節約。

ダンス参照動画と音声ベッドを提供;キャラクター画像がビートに合わせて振付モーションを実行。
Seedance 2.0 はネイティブ音声+マルチモーダル参照の最強オールラウンダー——ただし各モデルにスイートスポットあり。クレジットは ZOOOP 上のすべてで共通。
このページまたは動画ジェネレーターから Seedance 2.0 を開く。
参照画像を投入し、各々をタグ付け(キャラクター/小道具/シーン)。
シーンプロンプトを記述——Seedance はカメラワーク、ライティングキュー、対話台詞を認識。
長さ(4〜15 秒)、アスペクト比、解像度を選択し、生成をクリック。
Seedance 2.0 はシーンが必要とするものがテキストプロンプト以上のときに手に伸ばすモデル——監督が DP にムードボードの束、ワードローブシート、音声スクラッチトラック、スタント参照を手渡し、すべてが同じショットに落ちることを期待する場面。以前の Seedance 1.5 Pro はそれらの入力の一部を別々に受け取れた。Seedance 2.0 は一緒に受け取る:最大 9 枚の参照画像、3 つの動画クリップ、3 つの音声クリップが統合マルチモーダルアーキテクチャに入力、モデルがショットごとの重み付けを決定。
モデルを売る能力はロールベースアセットタグ。主人公の参照画像を投入し character_a とラベル;プロダクト静止画を投入し product_x とラベル;スタントダブル動画を参照し motion_ref とラベル。Seedance はタグ付きキャラクターを生成クリップの各カットで視覚的に一貫——同じ顔、同じ髪、同じ衣装——維持しつつ、モーション参照が動き方を決定。これは他のモデルがまだ苦しむ唯一のこと:5 秒クリップを生成すると主人公の髪色が途中でドリフト。Seedance 2.0 はロールをロック。
2 つ目の強みはビート認識音声同期。15 秒音楽ベッドを投入すると、モデルがカメラワーク、キャラクターモーション、ビジュアルカットをダウンビートに合わせて編集。これはネイティブ——後処理ではない。同じモデルがリップシンク付き対話と環境音(足音、ルームトーン、天候)も別途 TTS 不要で生成。2026 年 3 月時点で、Seedance 2.0 は公開リーダーボードでテキストto動画 Elo 1,269、画像to動画 Elo 1,351——両カテゴリで Kling 3.0、Veo 3、Runway Gen-4.5 に先んじて首位。
弱点:正直、ほぼどの能力でも弱点なし。Seedance 2.0 は現在のフラッグシップ中最強のオールラウンダー——公開 Elo ボードトップ、フル 1080p、ネイティブ音声、最深のマルチモーダル参照セット、そしてスクリプトすれば Kling V3 風マルチショット。仕上げティアモデル——品質が勝たなければならないときに手に伸ばし、20 個のクイックラフバリエーションの実行には使わない。方向性のイテレーションには Grok Imagine を高速で使用し、勝利プロンプトを Seedance に卒業させて仕上げ。
判断の目安:品質が勝たなければならないときは常に Seedance 2.0 をデフォルトに——参照密集ショット、仕上げカット、プレミアム納品物。方向性を見つける高速イテレーションには Grok Imagine。Veo 3.1 の専用 4K アップスケールパスが必要なら仕上げで切替。1 プロンプトでハードカット付きマルチショットストーリーボードには Kling V3。
統合マルチモーダルアーキテクチャ——Seedance 2.0 はテキスト、画像、音声、動画を組合せ入力として受け取り、1.5 Pro は別々に処理。最大の実利はキャラクター一貫性のためのロールタグ参照画像、ビート認識音声同期、別途 TTS 不要のネイティブ音声。
はい。対話、環境音、音楽スコアが同じ生成パスで動画とともに制作、視覚にリップシンク。音声参照も渡せ、ビジュアルがビートに合わせてカット。
4〜15 秒、ネイティブ 1080p まで。アスペクト比は 16:9、9:16、4:3、3:4、21:9、1:1 を含み、同じプロンプトからシネマティックマスターと縦型 SNS カットを再レンダリングなしで出荷可能。
Seedance 2.0 はテキストto動画と画像to動画の公開 Elo ランキングでリード、Kling 3.0、Veo 3、Runway Gen-4.5 がその後。1080p でも Veo 3.1 とマッチ。Veo の残差の差別化は専用 4K アップスケーラー;Kling V3 はより強力な明示的マルチショットストーリーボーディング。Seedance に能力の弱点なし——現在のフラッグシップ中最強のオールラウンダー。
はい——テキストto動画と画像to動画の公開 Elo リーダーボードでトップ。参照フレームでシードすると、被写体、フレーミング、スタイルをモーションに運び、ロールタグ参照がショット間でキャラクターを一貫。
画像
Videos
Audios
Prompt*
アスペクト比*
解決策*
デュレーション*