Seedance 2.0 モデルの紹介

Seedance 2.0は、画像、動画、音声、テキストの4つの入力モダリティをサポートし、より豊かな表現とより制御可能な生成を実現します。画像を視覚スタイル設定に、動画をキャラクターの動きやカメラの動きの指定に、数秒の音声をリズムとムードの設定に使用できます。これらをテキストプロンプトと組み合わせることで、作成プロセスはより自然で効率的になり、真に監督のような体験を提供します。

コアパラメーター

  • 画像入力:最大9枚、形式 jpeg/png/webp/bmp/tiff/gif、各最大30MB
  • 動画入力:最大3本、合計時間2-15秒、形式 mp4/mov、各最大50MB、解像度409600-927408
  • 音声入力:最大3ファイル、最大15秒、形式 mp3/wav、各最大15MB
  • テキスト入力:自然言語プロンプト、生成長さは4-15秒で自由に調整可能
  • 混合入力の合計ファイル数は12まで。視覚やリズムに最も影響を与える素材のアップロードを優先してください