Seedance 2.0プロンプトガイド

プロンプトの技術を習得して、素晴らしいAI生成ビデオを作成しましょう。このガイドでは、プロンプト技術、マルチモーダル参照、およびSeedance 2.0(Seedance 2.0 Fastにも適用可能)の実際の例を扱います。

目次

01 一般的なヒント

1.1 基本的なプロンプトの数式

Seedance 2.0は自然言語ロジックに深く従うため、必要に応じて以下の要素を柔軟に組み合わせることができます。

必須

Subject

プロンプトの論理的基盤 — 誰がどのようなアクションを実行しているかを明確に定義します。

必須

Motion

プロンプトの論理的基盤 — 誰がどのようなアクションを実行しているかを明確に定義します。

オプション

Environment

空間的な背景、照明の詳細、または特定の視覚スタイルを記述して全体的なトーンを設定します。

オプション

Aesthetics

空間的な背景、照明の詳細、または特定の視覚スタイルを記述して全体的なトーンを設定します。

オプション

Camera

没入型の視聴覚出力を得るために、カメラの振り付けや環境音響効果を使用します。

オプション

Audio

没入型の視聴覚出力を得るために、カメラの振り付けや環境音響効果を使用します。

1.2 マルチモーダル参照制御

テキスト記述だけでなく、参照資料を「与える」ことで、ビジュアルの理想的な基準を固定することができます。Seedance 2.0は、画像、音声、ビデオの深い参照をサポートしています。

参照を明確に指定する

プロンプトで何を参照するかを明確に指定します — 例:「画像1の構図を使用する」または「ビデオ2のアクションに従う」など。

正確な再現

モデルは参照オブジェクトからコア機能を自動的に抽出し、テキスト記述と結合することで、出力の忠実度と創造性の高さを保証します。

02 ビデオ内のテキスト

Seedance 2.0は、T2V(テキストからビデオ)、I2V(画像からビデオ)、R2V(参照からビデオ)、V2V(ビデオからビデオ)のシナリオでテキストオーバーレイを生成することをサポートしています。モデルは、コンテキストに基づいて適切なスタイルと色を自動的に一致させることができ、プロンプトでテキストの色、スタイル、表示方法、タイミング、位置を指定することもサポートしています。最良の結果を得るには、一般的な文字を使用し、珍しい文字や特殊記号は避けてください。

2.1 スローガン/タイトルテキスト

[テキストコンテンツ] + [表示タイミング] + [位置] + [表示方法]、[テキストスタイル(色、フォント)]

Seedance 2.0は、コンテキストに基づいて適切なテキストスタイルを自動的に一致させることができます。より厳密なテキスト表示要件については、3.2 複数画像参照 > ロゴ参照を参照してください。

製品とアニメーションスローガン

出力
参照入力
Image 1

Image 1

プロンプト

手描きのコミックスタイルで、3人が画像1のフライドチキンを一緒に食べている。和やかで楽しい雰囲気。その後、シーンが徐々にぼやけていき、画面中央に「Joy is in Seedance」というテキストが表示される。

2.2 字幕

画面下部に字幕コンテンツ「...」が表示され、音声のリズムに同期します。

字幕付きナレーション風景

出力
参照入力
Image 1

Image 1

プロンプト

ナレーション付きのビデオを生成します。深く落ち着いた男性の声で「広大な宇宙の中で、私たちの世界はほんの一瞬に過ぎない。しかしその中で、生命はあらゆる困難に打ち勝って繁栄している」と語られます。シーンは夜から夜明けにゆっくりと移行し、星が徐々に消え、山々の後ろから太陽が昇ります。ナレーションに合わせて画面下部に字幕が表示されます。

字幕付きオフィス会話

出力
参照入力
Image 1

Image 1

プロンプト

画像の中の2人がオフィスで会話しています。女性が最初に「あなたはいつも時間ぴったりに来るわね—ギリギリで間に合うのが好きなの?」と言います。男性は笑って「私には私のリズムがあるんだ」と答えます。会話はカジュアルで自然で、それぞれのセリフに合わせて画面下部に字幕が表示されます。

2.3 吹き出し

[キャラクター]が言います:「...」、キャラクターの周りにセリフテキストの吹き出しが表示されます。

吹き出し付きキャンパスランニングシーン

出力
参照入力
Image 1

Image 1

プロンプト

画像1の2人がスポーツウェアを着て、学校のトラックを走っています。女の子は男の子の方を見て、自信に満ちた笑顔で「私たちならきっとできるよ!」と言います。カメラが男の子のクローズアップに切り替わり、彼がためらいがちに「本当に?」と答えます。カメラが女の子のミディアムクローズアップに戻り、彼女は陽気に「はい!」と言います — 彼女の口調は明るく決然としています。話している各キャラクターの周りに、対応するセリフの吹き出しが表示されます。

吹き出し付きいちご畑のシーン

出力
参照入力
Image 1 & Image 2

Image 1 & Image 2

プロンプト

画像1と画像2の女の子の容姿を参考に、女の子がいちご畑でいちごを摘み、一口食べて笑顔で「これぞ本物!」と言います。女の子の周りにセリフテキストの吹き出しが表示されます。

03 画像参照

Seedance 2.0は、多角的な被写体参照と複数画像参照(シーン画像、ストーリーボードなど)の両方をサポートしています。特定の順序で画像をアップロードする際は、プロンプトでImage 1、Image 2... Image Nを使用して正確な参照を行ってください。

3.1 多角的な被写体参照

参照 / 抽出 / 結合 + [画像N]の[被写体]、[シーン記述]を生成し、一貫した[被写体]の特性を維持します。

参照オブジェクトを明確に指定するだけで、モデルはそれに応じて応答できます。ここでは、製品とキャラクターの例を紹介します。

3Cデジタル製品

出力
参照入力
Image 1, 2, 3

Image 1, 2, 3

プロンプト

画像1、画像2、画像3からカメラを抽出し、背景を白に置き換えます。カメラは白いテーブルの上に置かれ、レンズはカメラをクローズアップで捉え、その後ゆっくりとカメラの周りを主被写体として回転し、正面、側面、背面を明確に示します。

家庭用品

出力
参照入力
Reference Images

Reference Images

プロンプト

背景は温かみのある家庭のシーン。ミディアムショットで参照画像の魔法瓶が映し出されます。カメラはスムーズにクローズアップに寄り、その後、画面外から手が自然に入ってきて、優しくボトルを掴んで持ち上げます。カメラは手に追従し、手がわずかに回転して製品を披露します。

キャラクター参照

出力
参照入力
Image 1, 2, 3

Image 1, 2, 3

プロンプト

画像1、画像2、画像3の女性の容姿を参考に、喫茶店でケーキを食べる彼女のシーンを生成します。

3.2 複数画像参照

参照 / 抽出 / 結合 / 追従 / 生成 + [画像N]の[参照要素記述]、[シーン記述]を生成し、一貫した[参照要素]の特性を維持します。

ロゴ参照

出力
参照入力
Image 1 (Logo) & Image 2 (Character)

Image 1 (Logo) & Image 2 (Character)

プロンプト

背景はネオンライトが輝く未来都市の空中回廊で、車両とホログラフィック広告が絡み合っています。画像2の少女を参考に、まずミディアムショットで少女がホログラフィック投影された銀色の浮遊ランタンを放つのを見せ、その後カメラが引いて空いっぱいの浮遊ランタンを映し出します。シーンは徐々にぼやけていき、その後画像1のロゴが表示されます。全体的なスタイルは3DサイバーパンクSFアニメーションです。

複数被写体参照

出力
参照入力
Cat & Dog Reference Images

Cat & Dog Reference Images

プロンプト

画像中の猫と犬を参照します。居心地の良いアパートで、犬は横になってドッグフードを食べています。猫が近づいてきて、犬に前足を伸ばして触れます。犬は猫を見て食べるのをやめ、猫は犬の隣に寄り添います。シーンは温かい色調を使用しています。

複数要素参照

出力
参照入力
Image 1-5 (Girl, Outfit, Boy, Restaurant, Logo)

Image 1-5 (Girl, Outfit, Boy, Restaurant, Logo)

プロンプト

シーンは画像4のレストラン内で、人々が行き交っています。画像1の女の子は画像2の服装をして、カウンターの品物を整理しています。画像3の男の子は客としてやってきて、女の子に連絡先を尋ねます。画像5のロゴは常に画面右下隅に表示されます。

マルチパネルストーリーボード

出力
参照入力
Storyboard Image

Storyboard Image

プロンプト

画像内のストーリーボードを参照し、激しい戦闘シーンを生成します。各パネルの構図が順番に表示され、その後、2人のキャラクター間の激しい戦いが続きます。

キャラクター付きストーリーボード

出力
参照入力
Image 1-4 (Girl, Dad, Storyboard panels)

Image 1-4 (Girl, Dad, Storyboard panels)

プロンプト

画像3のストーリーボードの構図に従います。女の子が父親が料理を終えるのを待っています。彼女は「パパ、お腹すいた!ご飯まだ?」と言います。女の子の容姿は画像1を参照しています。その後、カメラは右にパンして画像4のシーンと構図に切り替わります。父親の容姿は画像2を参照しています。父親は「もうすぐだ、もうちょっと待ってて!」と答えます。その後、カメラは少しがっかりした様子の娘のクローズアップに戻り、「まだなの?いい匂いなのに…」と言います。その後、父親のクローズアップに切り替わり、「本当にあと少しだ。急かさないでまず手を洗ってきなさい!」と言います。

04 ビデオ参照

Seedance 2.0はビデオ参照をサポートしています。生成するコンテンツと参照オブジェクトを明確に指定するだけです。特定の順序でビデオをアップロードする際は、プロンプトでVideo 1、Video 2... Video Nを使用して正確な参照を行ってください。

4.1 アクション参照

[ビデオN]の[アクション記述]を参照し、一貫したアクション詳細を維持しながら[シーン記述]を生成します。

映画/アクションシーン

出力
参照入力

Video 1 (Action Reference)

Image 1 & Image 2 (Characters)

Image 1 & Image 2 (Characters)

プロンプト

ビデオ1のキャラクターアクションとカメラワークを参照し、画像2と画像1の間の格闘シーンを生成します。画像2は左側のキャラクターで、画像1は右側のキャラクターです。激しいBGMとともに。

マーケティング/商品広告

出力
参照入力

Video 1 (Horse Running)

プロンプト

ビデオ1の馬の走り方を参考に、草原を駆ける黄金の馬を生成し、その壮大な走行ポーズをフリーズフレームで止め、馬の形をした金のペンダントに変身させます。

4.2 カメラワーク参照

[ビデオN]の[カメラワーク記述]を参照し、一貫したカメラワークを維持しながら[シーン記述]を生成します。

テックパークコンセプトムービー

出力
参照入力

Video 1 (Camera Reference)

Image 1 (Tech Park)

Image 1 (Tech Park)

プロンプト

ビデオ1のカメラワークを参照して、テックパークのコンセプトビデオを作成します。画像1の高層ビルを視覚的な中心として使用し、同じ一人称ダイビング視点で、画像1のパークの技術的な美しさを強調します。

4.3 エフェクト参照

[ビデオN]の[エフェクト記述]を参照し、一貫したエフェクトを維持しながら[シーン記述]を生成します。

映画/パーティクルエフェクト

出力
参照入力

Video 1 (Particle Effect)

Image 1 (Character)

Image 1 (Character)

プロンプト

ビデオ1の金色のパーティクルエフェクトを参照し、画像2のキャラクターが同じパーティクルエフェクトに囲まれながらフルートを吹くようにします。

楽しい/翼のエフェクト

出力
参照入力

Video 1 (Wings Effect)

Image 1 (Girl)

Image 1 (Girl)

プロンプト

ビデオ1のエフェクトを参照して、画像1の女の子に同じ翼を生やさせ、翼の生成軌跡を完全に一致させます。

05 ビデオ編集

Seedance 2.0は、要素の追加、削除、変更、ビデオの前方または後方への延長、トラックの結合を含むビデオ編集をサポートしています。特定の順序でビデオをアップロードする際は、プロンプトでVideo 1、Video 2... Video Nを使用してください。

5.1 要素の追加/削除/変更

要素の追加: [ビデオN]の[時間位置] + [空間位置]に[必要な要素記述]を追加します。
要素の削除: [ビデオN]から[要素]を削除し、それ以外のすべては変更しません。
要素の変更: [ビデオN]の[元の要素記述]を[必要な要素記述]に置き換えます。

要素の追加

出力
参照入力

Video 1 (Original)

プロンプト

ビデオ1のカウンターにフライドチキン、ピザ、その他の軽食を追加します。

要素の削除

出力
参照入力

Video 1 (Original)

プロンプト

ビデオ1のデスクトップから他の部品やツールを削除し、デスクトップを清潔で整頓された状態に保ちます — 彼らが手に持っているアイテムだけを残します。

要素の変更

出力
参照入力

Video 1 (Original)

Image 1 (Face Cream)

Image 1 (Face Cream)

プロンプト

ビデオ1の香水を画像1のフェイスクリームに置き換え、動きとカメラワークは変更しません。

5.2 ビデオの拡張

[ビデオN]を前方/後方に拡張 + [拡張コンテンツの説明]。または: [ビデオN]の前/後のコンテンツを生成 + [説明]。

モデルはシームレスな合成のために接続部分を自動的にキャプチャします。元のビデオセグメントは重複しません。

後方拡張

出力
参照入力

Video 1 (Original)

プロンプト

ビデオ1の後のコンテンツを生成します。2人の遅れてきた男性が彼らに向かって走り、全員で5人が最終的に出会い、楽しくおしゃべりします。

前方拡張

出力
参照入力

Video 1 (Original)

プロンプト

ビデオ1を前方に拡張し、白い服の男性のオーバーザショルダーショットを追加します。白い服の男性が「そんなに悪くないよ。ただストレスがあるだけだ。みんなこれを経験するんだ、ただやり続けるしかない。」と言います。

5.3 トラック結合

[ビデオ1] + [トランジション記述] + [ビデオ2]に接続 + [トランジション記述] + [ビデオ3]に接続

Seedance 2.0は、合計15秒を超えない最大3つのビデオ入力をサポートしています。システムは、最初のビデオと最後のビデオの接続部分を自動的にキャプチャし、合成に必要なセグメントのみを保持します。

シーン間の葉のトランジション

出力
参照入力

Video 1

Video 2

プロンプト

ビデオ1、葉が地面に触れた瞬間に金色のパーティクルエフェクトが爆発し、突風が吹きます。その後、ビデオ2に接続します。