图像提示词规则

不同的文生图应用对提示词的处理方式不同。下面先讲对所有模型都成立的通用规则,再按流派说明各自的加权语法。

通用规则(所有模型适用)

  • 词语顺序:越靠前的词权重越大,把最重要的主体放在开头。
  • 数量控制:一张图的主体保持在两三个以内,过多会互相干扰。
  • 长度建议:保持精简(约 380 字符内)更易复现效果,也方便快速迭代。

Stable Diffusion 系(WebUI、ComfyUI 等)

  • 括号加权(word) 轻度强调,可叠加(如 ((word)));(masterpiece:1.5) 直接指定权重倍数。
  • 融合 / 切换:中括号语法。[blue hair|white hair] 让两种元素逐步交替,效果近似融合;[blue hair:white hair:0.3] 表示画到 30% 进度时从蓝发切换为白发。
  • 负面提示:不想要的元素写进独立的「负面提示」输入框(如 blurry, bad anatomy, extra fingers)。IMGPrompt 的「负面词」按钮可一键复制一套常用负面词。

Midjourney

  • 权重词组::数字,如 sunset::2 desert::1 表示日落的重要性是沙漠的两倍。
  • 排除元素:用 --no 参数,如 --no tree 生成没有树的画面。

自然语言模型(FLUX、GPT-Image、Veo、Kling 等)

不需要任何特殊符号——用完整、具体的句子描述画面,重要内容放前面,想排除的直接写出来(如"画面中没有树")。镜头、光线、艺术风格等用词照常从标签库挑选即可。