กฎของพรอมต์ภาพ

แอปสร้างภาพจากข้อความแต่ละตัวประมวลผลพรอมต์ไม่เหมือนกัน ด้านล่างเริ่มจากกฎทั่วไปที่ใช้ได้กับทุกโมเดล แล้วจึงอธิบายไวยากรณ์ถ่วงน้ำหนักของแต่ละตระกูล

กฎทั่วไป (ใช้ได้กับทุกโมเดล)

  • ลำดับคำ — คำที่อยู่ต้นพรอมต์มีน้ำหนักมากกว่า ให้วางวัตถุหลักที่สำคัญที่สุดไว้ตอนต้น
  • คุมจำนวน — วัตถุหลักในภาพหนึ่งควรมีไม่เกินสองถึงสามอย่าง มากกว่านั้นจะรบกวนกันเอง
  • ความยาว — พรอมต์ที่กระชับ (ราว 380 ตัวอักษรหรือน้อยกว่า) ทำซ้ำผลลัพธ์ได้เสถียรกว่าและปรับแก้ได้เร็วกว่า

ตระกูล Stable Diffusion (WebUI, ComfyUI ฯลฯ)

  • วงเล็บถ่วงน้ำหนัก(word) เน้นเล็กน้อยและซ้อนได้ (เช่น ((word))) ส่วน (masterpiece:1.5) ระบุตัวคูณน้ำหนักโดยตรง
  • ผสม / สลับ — ไวยากรณ์วงเล็บเหลี่ยม [blue hair|white hair] ให้สององค์ประกอบสลับกันทีละขั้นจนได้ลุคแบบผสม ส่วน [blue hair:white hair:0.3] หมายถึงสลับจากผมสีน้ำเงินเป็นสีขาวเมื่อวาดถึง 30% ของกระบวนการ
  • พรอมต์เชิงลบ — ใส่องค์ประกอบที่ไม่ต้องการลงในช่องพรอมต์เชิงลบโดยเฉพาะ (เช่น blurry, bad anatomy, extra fingers) ปุ่ม เชิงลบ ของ IMGPrompt คัดลอกชุดคำเชิงลบยอดนิยมให้ในคลิกเดียว

Midjourney

  • น้ำหนักวลี::ตัวเลข เช่น sunset::2 desert::1 หมายถึงพระอาทิตย์ตกสำคัญเป็นสองเท่าของทะเลทราย
  • ตัดองค์ประกอบ — ใช้พารามิเตอร์ --no เช่น --no tree เพื่อสร้างภาพที่ไม่มีต้นไม้

โมเดลภาษาธรรมชาติ (FLUX, GPT-Image, Veo, Kling ฯลฯ)

ไม่ต้องใช้สัญลักษณ์พิเศษใด ๆ — บรรยายภาพด้วยประโยคที่สมบูรณ์และเจาะจง วางสิ่งสำคัญไว้ก่อน และเขียนสิ่งที่ไม่ต้องการออกมาตรง ๆ (เช่น "ไม่มีต้นไม้ในภาพ") ส่วนคำเกี่ยวกับมุมกล้อง แสง และสไตล์ศิลปะ ก็เลือกจากคลังแท็กมาใช้ได้ตามปกติ