画像プロンプトのルール

テキストから画像を生成するアプリは、それぞれプロンプトの扱い方が異なります。まずすべてのモデルに共通する基本ルールを押さえ、そのうえで系統ごとの重み付け構文を説明します。

共通ルール(すべてのモデルに適用)

  • 語順:前にある語ほど重みが大きくなります。最も重要な主体を先頭に置きましょう。
  • 数のコントロール:1枚の画像に入れる主体は2〜3個以内に。多すぎると互いに干渉します。
  • 長さの目安:簡潔(約380文字以内)に保つほうが効果を再現しやすく、素早い試行錯誤にも向きます。

Stable Diffusion 系(WebUI、ComfyUI など)

  • 括弧の重み付け(word) は軽い強調で、重ねがけできます(例 ((word)))。(masterpiece:1.5) のように重みの倍率を直接指定することも可能です。
  • ブレンド / 切り替え:角括弧の構文です。[blue hair|white hair] は2つの要素を1ステップごとに交互に描き、ブレンドに近い効果になります。[blue hair:white hair:0.3] は進行度30%の時点で青髪から白髪へ切り替えます。
  • ネガティブプロンプト:不要な要素は専用の「ネガティブプロンプト」入力欄に書きます(例 blurry, bad anatomy, extra fingers)。IMGPrompt の ネガティブ ボタンを使えば、定番のネガティブプロンプト一式をワンクリックでコピーできます。

Midjourney

  • 重みフレーズ::数値 の形式です。例えば sunset::2 desert::1 は、夕日を砂漠の2倍重要なものとして扱います。
  • 要素の除外--no パラメータを使います。例えば --no tree で木のない画面を生成できます。

自然言語モデル(FLUX、GPT-Image、Veo、Kling など)

特別な記号は一切不要です——完全で具体的な文章で画面を描写し、重要な内容を前に置き、除外したいものはそのまま言葉で書きます(例:「画面に木はない」)。カメラ・ライティング・アートスタイルなどの用語は、これまでどおりタグ集から選べばOKです。