Quy tắc prompt ảnh

Mỗi ứng dụng tạo ảnh từ văn bản xử lý prompt theo cách khác nhau. Phần dưới đây trình bày trước các quy tắc chung đúng với mọi mô hình, rồi đến cú pháp trọng số của từng dòng mô hình.

Quy tắc chung (mọi mô hình)

Thứ tự từ: từ đứng càng trước trọng số càng lớn — đặt chủ thể quan trọng nhất lên đầu.
Kiểm soát số lượng: mỗi ảnh chỉ nên giữ hai đến ba chủ thể chính; nhiều hơn sẽ gây nhiễu lẫn nhau.
Độ dài: prompt gọn gàng (trong khoảng 380 ký tự) dễ tái hiện kết quả hơn và cũng tiện thử nghiệm nhanh.

Dòng Stable Diffusion (WebUI, ComfyUI, v.v.)

Trọng số ngoặc đơn: (word) nhấn mạnh nhẹ, có thể chồng lớp (như ((word))); (masterpiece:1.5) chỉ định trực tiếp hệ số trọng số.
Pha trộn / chuyển đổi: cú pháp ngoặc vuông. [blue hair|white hair] cho hai yếu tố luân phiên từng bước, hiệu quả gần như pha trộn; [blue hair:white hair:0.3] nghĩa là chuyển từ tóc xanh sang tóc trắng khi vẽ được 30% tiến độ.
Prompt tiêu cực: viết các yếu tố không mong muốn vào ô "prompt tiêu cực" riêng (như blurry, bad anatomy, extra fingers). Nút Tiêu cực của IMGPrompt sao chép sẵn một bộ từ tiêu cực thông dụng chỉ với một cú nhấp.

Midjourney

Trọng số: cụm từ::số, ví dụ sunset::2 desert::1 nghĩa là hoàng hôn quan trọng gấp đôi sa mạc.
Loại trừ yếu tố: dùng tham số --no, ví dụ --no tree để tạo khung cảnh không có cây.

Mô hình ngôn ngữ tự nhiên (FLUX, GPT-Image, Veo, Kling, v.v.)

Không cần ký hiệu đặc biệt nào — hãy mô tả khung cảnh bằng câu hoàn chỉnh, cụ thể, đặt nội dung quan trọng lên trước, và viết thẳng những gì muốn loại bỏ (ví dụ "không có cây trong khung hình"). Các từ về góc máy, ánh sáng, phong cách nghệ thuật vẫn chọn từ kho thẻ như bình thường.