Seedance 2.0 モデルの紹介

Seedance 2.0は、画像、動画、音声、テキストの4つの入力モダリティをサポートし、より豊かな表現とより制御可能な生成を実現します。画像を視覚スタイル設定に、動画をキャラクターの動きやカメラの動きの指定に、数秒の音声をリズムとムードの設定に使用できます。これらをテキストプロンプトと組み合わせることで、作成プロセスはより自然で効率的になり、真に監督のような体験を提供します。

現在の Web アプリ提供範囲

seedance2.app が現在公開しているのは text-to-video と image-to-video です。Seedance 2.0 は有料アップグレードで、公開出力は最大 1080p、15 秒まで対応しています。以下の一部ページでは、現在の Web アプリでまだ完全には公開されていない広いモデルワークフローやプロンプト例も扱っています。

コアパラメーター

画像入力：最大9枚、形式 jpeg/png/webp/bmp/tiff/gif、各最大30MB
動画入力：最大3本、合計時間2-15秒、形式 mp4/mov、各最大50MB、解像度409600-927408
音声入力：最大3ファイル、最大15秒、形式 mp3/wav、各最大15MB
テキスト入力：自然言語プロンプト、生成長さは4-15秒で自由に調整可能
混合入力の合計ファイル数は12まで。視覚やリズムに最も影響を与える素材のアップロードを優先してください