Prompt Guide FLUX.2

1. ภาพรวมของเทคโนโลยี (Introduction)

Flux.2 จาก Black Forest Labs (BFL) ถือเป็นจุดเปลี่ยนสำคัญของวงการ AI สร้างภาพ โดยประกาศตนว่าเป็นยุคแห่ง “ความแม่นยำระดับอุตสาหกรรม” (Industrial-Grade Precision) สิ่งที่เปลี่ยนแปลงอย่างชัดเจนคือการเปลี่ยนสถาปัตยกรรมจากแบบ Diffusion ดั้งเดิม มาเป็น Rectified Flow Transformer ซึ่งช่วยสร้าง “ทางตรง” ในการประมวลผล ทำให้ลดความผันผวนและเพิ่มประสิทธิภาพการทำงานอย่างมหาศาล นอกจากนี้ยังเปลี่ยนสมองกลในการเข้าใจภาษามาใช้ Mistral-3 Vision-Language Model (VLM) ทำให้โมเดลมีความเข้าใจบริบท ตรรกะทางกายภาพ และความสัมพันธ์เชิงพื้นที่ได้ดีกว่ารุ่นก่อนหน้าอย่างมาก

2. ขีดความสามารถเด่น (Key Capabilities)

Flux.2 มีความสามารถที่ออกแบบมาเพื่อการใช้งานระดับมืออาชีพ โดยมีจุดเด่นดังนี้:

การควบคุมสีที่แม่นยำ (Exact Color Steering): สามารถระบุรหัสสีฐานสิบหก (Hex Code) เช่น #86E04A ลงในคำสั่งได้โดยตรง เพื่อให้ได้สีที่ถูกต้องแม่นยำตามต้องการ เหมาะอย่างยิ่งสำหรับงานที่ต้องคุมโทนสีแบรนด์ (CI)
โครงสร้างคำสั่งแบบ JSON (JSON Structured Prompting): รองรับการสั่งงานด้วยโครงสร้างข้อมูล ซึ่งช่วยแก้ปัญหา “สีรั่วไหล” (เช่น สั่งเสื้อแดง กางเกงน้ำเงิน แต่สีสลับกัน) โดยสามารถผูกคุณลักษณะเฉพาะเข้ากับวัตถุนั้น ๆ ได้อย่างสมบูรณ์
ความสมจริงทางฟิสิกส์ (Physical Camera Simulation): ไม่ได้ทำแค่เบลอภาพ แต่จำลองผลทางออปติคอลตามค่ารูรับแสง (Aperture) และระยะเลนส์จริง ทำให้ระยะชัดลึก (Depth of Field) และแสงเงาถูกต้องตามหลักฟิสิกส์
ความเร็วระดับเสี้ยววินาที (Sub-second Generation): ในโมเดลรุ่นเล็กอย่าง Flux.2 [klein] สามารถสร้างภาพได้ในเวลาน้อยกว่า 1 วินาที แต่ยังคงความสามารถในการเรนเดอร์ข้อความได้ดี

3. หลักการสั่งงานอย่างมืออาชีพ (Prompt Engineering Guide)

Flux.2 เปลี่ยนแนวคิดการเขียนคำสั่ง โดยให้ความสำคัญกับ “ลำดับชั้นของความสนใจ” (Hierarchy of Attention) ตามโครงสร้างมาตรฐาน 4 องค์ประกอบ:

ประธาน (Subject): สิ่งที่สำคัญที่สุดต้องอยู่ต้นประโยค
การกระทำ (Action): กิริยาอาการและการเคลื่อนไหว
สไตล์ (Style): รูปแบบทางศิลปะหรือเทคนิคการถ่ายทำ
บริบท (Context): ฉากหลังและบรรยากาศ

เทคนิคสำคัญ:

ปรัชญา “No Negative Prompt”: ระบบนี้ไม่รองรับคำสั่งเชิงลบ (เช่น “no blur”, “no bad hands”) การใส่คำเหล่านี้อาจยิ่งกระตุ้นให้เกิดสิ่งที่ไม่อยากได้ ให้ใช้การบรรยายเชิงบวกแทน เช่น “Sharp focus” หรือ “Anatomically correct”
การเรนเดอร์ข้อความ: ให้ใช้เครื่องหมายคำพูดคู่ (“…”) ครอบข้อความที่ต้องการเสมอ และควรระบุฟอนต์ สี และตำแหน่งไปพร้อมกัน

การใช้ JSON: สำหรับฉากที่ซับซ้อนหรือมีวัตถุหลายชิ้น ให้เปลี่ยนจากการเขียนบรรยายยาว ๆ มาใช้โครงสร้าง JSON เพื่อระบุรายละเอียดของแต่ละวัตถุแยกกัน

4. ข้อควรระวังและแนวทางการแก้ไขปัญหา (Precautions & Troubleshooting)

ผู้ใช้งานควรปรับแต่งพารามิเตอร์ให้เหมาะสมกับประเภทของงาน เพื่อป้องกันผลลัพธ์ที่ไม่พึงประสงค์:

การตั้งค่า Guidance Scale:
- ค่าต่ำ (2.0 – 2.5): ให้ความคิดสร้างสรรค์สูง ภาพดูเป็นธรรมชาติ
- ค่าสูง (5.0+): บังคับให้ตรงตามคำสั่งเคร่งครัด เหมาะกับงานสินค้าหรือโลโก้ แต่ถ้าสูงเกินไปภาพอาจดูแข็งและไม่เป็นธรรมชาติ
ความละเอียดภาพ: โมเดลทำงานได้ดีที่สุดเมื่อความละเอียดเป็นพหุคูณของ 16 (เช่น 1024×1024)
การเลือกโมเดล: หากต้องการทดลองไอเดียให้ใช้รุ่น [klein] เพื่อประหยัดต้นทุน แล้วจึงสลับไปใช้รุ่น [pro] หรือ [max] โดยใช้ Seed เดิมในการสร้างภาพสุดท้าย (Final Render)

5. บทสรุปการใช้งาน (Conclusion)

Flux.2 ได้ยกระดับ AI สร้างภาพจาก “ของเล่นเชิงทดลอง” สู่ “เครื่องมือทางอุตสาหกรรม” อย่างเต็มรูปแบบ จุดเด่นเรื่องความเข้าใจโครงสร้างข้อมูลที่ซับซ้อนและการควบคุมที่แม่นยำ ทำให้ผู้ใช้งานต้องปรับตัวจากการเป็นเพียงผู้ป้อนคำศัพท์ มาเป็นผู้เชี่ยวชาญด้านเทคนิคที่สามารถสั่งงานผ่านโค้ด (JSON) และเข้าใจค่าทางฟิสิกส์ เพื่อดึงศักยภาพสูงสุดของโมเดลออกมาใช้ในงานธุรกิจจริง