ถ้าใครรู้สึกว่าช่วงหลังมานี้ AI สร้างภาพเริ่มใช้งานจริงมากขึ้นเรื่อย ๆ ไม่ได้คิดไปเองครับ เพราะล่าสุดทาง OpenAI เองก็ประกาศอัปเดตใหญ่ของ ChatGPT Images อย่างเป็นทางการ พร้อมโมเดลภาพรุ่นใหม่ GPT Image 1.5 ถ้าดูผิวเผินการอัปเดตรอบนี้อาจดูเหมือนแค่การเปลี่ยนโมเดลสร้างภาพ แต่ในความเป็นจริง นี่คือการขยับบทบาทของ ChatGPT ให้กลายเป็นเครื่องมือสร้างสรรค์ที่ใช้งานจริงมากขึ้นอย่างชัดเจนครับ
OpenAI อธิบายการอัปเดตครั้งนี้ว่า ไม่ว่าจะเริ่มสร้างภาพใหม่ตั้งแต่ศูนย์ หรือเอาภาพเดิมมาแก้ โมเดลจะพยายามให้ผลลัพธ์ออกมาตรงกับสิ่งที่เราคิดไว้ให้มากที่สุด จุดเด่นคือความแม่นยำในการแก้รายละเอียด การคงหน้าตาและรูปลักษณ์ของตัวละคร และความเร็วที่เพิ่มขึ้นสูงสุดถึงประมาณ 4 เท่า ซึ่งทั้งหมดนี้สามารถใช้งานผ่าน ChatGPT โดยตรงครับ
1. แก้ภาพแม่นขึ้น แต่ยังรักษาสิ่งสำคัญไว้ครบ
หนึ่งในปัญหาใหญ่ของ AI สร้างภาพก่อนหน้านี้คือ ยิ่งแก้หลายรอบ หน้ายิ่งเพี้ยน บริบทภาพยิ่งหลุด แต่ GPT Image 1.5 ถูกออกแบบมาเพื่อแก้โจทย์นี้โดยตรงครับ เมื่อเราอัปโหลดภาพเข้าไปแล้วขอให้แก้ โมเดลจะเปลี่ยนเฉพาะสิ่งที่เราร้องขอจริง ๆ และพยายามคงองค์ประกอบสำคัญไว้ทั้งหมด ไม่ว่าจะเป็นแสง องค์ประกอบภาพ โทน รวมถึงหน้าตาและรูปลักษณ์ของคน ทำให้การแก้ไขครั้งต่อ ๆ ไปยังต่อเนื่องจากภาพเดิมได้อย่างสม่ำเสมอครับ
ผลลัพธ์คือภาพที่ตรงใจมากขึ้นในงานหลากหลายรูปแบบ ตั้งแต่งานแก้ภาพที่ต้องใช้งานจริง เช่น การลองเสื้อผ้า ทรงผม การตีความภาพใหม่ หรือการปรับคอนเซปต์ โดยที่แก่นของภาพต้นฉบับยังอยู่ครบ ไม่ต้องเริ่มใหม่ทุกครั้งครับ
โดย GPT Image 1.5 ถูกออกแบบมาให้เด่นทั้งการเพิ่ม ลบ รวม ผสม หรือจัดวางองค์ประกอบใหม่ในภาพ โมเดลจะพยายามรักษาเอกลักษณ์ของภาพไว้ให้มากที่สุด ขณะเดียวกันก็ทำให้เราสร้างสรรค์ภาพได้ง่ายขึ้น ไม่ว่าจะเป็นการเพิ่มข้อความ เลย์เอาต์ หรือองค์ประกอบใหม่เพื่อทำให้ไอเดียเห็นภาพได้จริงครับ
2. การปฏิบัติตามคำสั่ง
โมเดลนี้ทำตามคำสั่งได้ดีและสม่ำเสมอกว่ารุ่นแรกครับ ทำให้การแก้ไขทำได้อย่างแม่นยำยิ่งขึ้น รวมถึงการสร้างองค์ประกอบที่ซับซ้อนกว่าเดิม โดยองค์ประกอบต่าง ๆ ไม่ได้เปลี่ยนไป แต่คงไว้เหมือนเดิมครับ
3. การยกระดับคุณภาพเพิ่มเติม
นอกจากนั้นโมเดลใหม่นี้ยังได้รับการปรับปรุงเรื่องคุณภาพด้วยครับ ซึ่งช่วยให้ผลลัพธ์พร้อมใช้งานได้ทันทีครับ เช่น การแสดงใบหน้าขนาดเล็กของคนจำนวนมากได้อย่างชัดเจน และความเป็นธรรมชาติของภาพที่ได้ครับ
ถึงแม้โมเดลนี้จะถูกพัฒนาขึ้นมาเยอะมาก แต่ก็ยังมีข้อจำกัดบางอย่าง เช่น มีข้อจำกัดในการรองรับบางภาษาอย่าง ภาษาจีน ภาษาอาหรับ และภาษาฮีบรู รวมทั้งภาษาไทยที่สระยังลอยอยู่บ้างครับ หรือ เมื่อมีคนจำนวนมากในภาพที่ต้องการให้คงใบหน้าไว้เหมือนเดิม โมเดลยังไม่สามารถทำให้ทุกคนออกมาเหมือนเดิมได้ 100% ครับ
3. GPT Image 1.5 บน API
และสำหรับฝั่งนักพัฒนา GPT Image 1.5 เปิดให้ใช้งานผ่าน API ในชื่อ gpt-image-1.5 พร้อมความสามารถเดียวกับ ChatGPT Images โดยเด่นเรื่องการคงโลโก้แบรนด์และองค์ประกอบสำคัญได้ดีกว่า GPT Image 1 อย่างชัดเจนครับ และอีกหนึ่งจุดที่น่าสนใจคือค่าใช้จ่ายสำหรับอินพุตและเอาต์พุตของภาพใน GPT Image 1.5 ลดลง 20% เมื่อเทียบกับ GPT Image 1 ทำให้สามารถสร้างและปรับภาพซ้ำได้มากขึ้นภายใต้งบประมาณเท่าเดิมครับ
เมื่อนำ ChatGPT Images ไปเทียบกับ Nano Banana ถึงในแง่ความธรรมชาติ และภาษา Nano Banana จะยังทำได้ดีกว่าแต่สิ่งที่ ChatGPT Images ทำได้ดีกว่าแบบเห็นได้ชุดคือ การแก้ภาพซ้ำ GPT Image 1.5 รักษาหน้าตาและรูปลักษณ์ของตัวละครได้สม่ำเสมอมาก เปลี่ยนเสื้อ เปลี่ยนฉาก เพิ่มของในภาพ หน้าเดิมยังเป็นหน้าเดิมครับ
ในขณะที่ Nano Banana แม้ภาพรอบแรกจะสวยและสมจริงมาก แต่เมื่อแก้หลายรอบ มีโอกาสที่หน้าหรือรายละเอียดจะเริ่ม drift ได้ โดยเฉพาะถ้าแก้เชิงโครงสร้างภาพเยอะ ๆ ครับ
ตอนนี้ ChatGPT Images ใหม่นี้กำลัง ทยอยเปิดให้ใช้งานสำหรับผู้ใช้ ChatGPT และผู้ใช้ API ทั่วโลก แล้วครับ โดยที่เราสามารถเข้าไปลองเล่นได้เลย ไม่ต้องติดตั้งอะไรเพิ่มครับ ผมเชื่อว่านี่เป็นเพียงจุดเริ่มต้นครับ ในอนาคตข้างหน้า Open AI น่าจะสามารถพัฒนาโมเดลเพิ่มขึ้น ทำให้เราสามารถทำงานได้มากขึ้น ตั้งแต่การแก้ไขที่ละเอียดขึ้น ไปจนถึงรายละเอียดด้านภาษา โดยเฉพาะภาษาไทยครับ
ต้องบอกว่าด้วยคุณภาพที่ดีขึ้นทั้งด้านความสมจริงและความสม่ำเสมอ ChatGPT Images เวอร์ชันใหม่นี้ เริ่มตอบโจทย์งานเชิงพาณิชย์มากขึ้นครับ ไม่ว่าจะเป็นภาพสินค้า โปสเตอร์ อินโฟกราฟิก หรือคอนเทนต์โซเชียลที่ต้องแก้ไขบ่อยโดยไม่เสียคาแรกเตอร์เดิมครับ
ChatGPT Images เวอร์ชันใหม่ ไม่ได้แค่สร้างภาพเก่งขึ้น แต่กำลังขยับเข้าใกล้คำว่า ภาพที่ใช้งานได้จริงมากขึ้นอย่างชัดเจน ครับ ทั้งความสมจริงที่ดีขึ้น หน้าไม่เพี้ยน และการรักษาบริบทของภาพนั้น ๆ ทำให้ AI สร้างภาพเริ่มกลายเป็นเครื่องมือทำงาน ไม่ใช่แค่ของเล่นทดลองอีกต่อไปครับ
ทุกวันนี้เทคโนโลยีไปไกลมากขึ้น ถ้าเราใช้อย่างถูกต้องก็จะสามารถสร้างประโยชน์ให้เรามากมายมหาศาลครับ ทั้งด้านการทำงาน และในชีวิตประจำวัน แต่หากใช้ผิดวิธีก็จะเกิดโทษได้ครับ ผมหวังว่าทุกคนจะนำการพัฒนาของเทคโนโลยีและบทความนี้ไปใช้ให้เกิดประโยชน์ ไม่มากก็น้อยนะครับ ฝากติดตามบทความด้านการใช้ AI แบบนี้ด้วยนะครับ หรือใครอยากให้นำ AI ตัวไหนมาเล่าให้ฟัง สามารถคอมเมนต์บอกกันได้เลยครับ
สำหรับนักอ่านที่ชอบ และ อยากอ่านบทความเกี่ยวกับการตลาด, Data และ AI เพิ่มเติม สามารถติดตามได้จาก เพจการตลาดวันละตอน รวมไปถึง Twitter Instagram YouTube ของการตลาดวันละตอนได้เลยนะครับ แล้วพบกันใหม่ในบทความหน้าครับ
Source