画像プロンプトのルール
テキストから画像を生成するアプリは、それぞれプロンプトの扱い方が異なります。まずすべてのモデルに共通する基本ルールを押さえ、そのうえで系統ごとの重み付け構文を説明します。
共通ルール(すべてのモデルに適用)
- 語順:前にある語ほど重みが大きくなります。最も重要な主体を先頭に置きましょう。
- 数のコントロール:1枚の画像に入れる主体は2〜3個以内に。多すぎると互いに干渉します。
- 長さの目安:簡潔(約380文字以内)に保つほうが効果を再現しやすく、素早い試行錯誤にも向きます。
Stable Diffusion 系(WebUI、ComfyUI など)
- 括弧の重み付け:
(word)は軽い強調で、重ねがけできます(例((word)))。(masterpiece:1.5)のように重みの倍率を直接指定することも可能です。 - ブレンド / 切り替え:角括弧の構文です。
[blue hair|white hair]は2つの要素を1ステップごとに交互に描き、ブレンドに近い効果になります。[blue hair:white hair:0.3]は進行度30%の時点で青髪から白髪へ切り替えます。 - ネガティブプロンプト:不要な要素は専用の「ネガティブプロンプト」入力欄に書きます(例
blurry, bad anatomy, extra fingers)。IMGPrompt の ネガティブ ボタンを使えば、定番のネガティブプロンプト一式をワンクリックでコピーできます。
Midjourney
- 重み:
フレーズ::数値の形式です。例えばsunset::2 desert::1は、夕日を砂漠の2倍重要なものとして扱います。 - 要素の除外:
--noパラメータを使います。例えば--no treeで木のない画面を生成できます。
自然言語モデル(FLUX、GPT-Image、Veo、Kling など)
特別な記号は一切不要です——完全で具体的な文章で画面を描写し、重要な内容を前に置き、除外したいものはそのまま言葉で書きます(例:「画面に木はない」)。カメラ・ライティング・アートスタイルなどの用語は、これまでどおりタグ集から選べばOKです。