Gemini Omni เมื่อ AI ไม่ได้แค่เข้าใจ แต่เริ่มสร้างจากสิ่งที่เรามี
ในช่วงไม่กี่ปีที่ผ่านมา เราเห็น AI เปลี่ยนบทบาทจากเครื่องมือช่วยตอบคำถาม มาเป็นเครื่องมือช่วยเขียน ช่วยออกแบบ ช่วยวิเคราะห์ และช่วยสร้างภาพ แต่สิ่งที่น่าสนใจคือ เส้นแบ่งระหว่าง “การคิด” กับ “การสร้าง” กำลังเริ่มบางลงเรื่อย ๆ ล่าสุด Google เปิดตัว Gemini Omni โมเดลใหม่ในตระกูล Gemini ที่ถูกวางให้เป็นก้าวสำคัญของ AI แบบ Multimodal หรือ AI ที่ทำงานกับข้อมูลได้หลายรูปแบบพร้อมกัน ไม่ว่าจะเป็นข้อความ ภาพ เสียง หรือวิดีโอ โดยโมเดลแรกที่เปิดตัวคือ Gemini Omni Flash ซึ่งเริ่มต้นจากความสามารถด้านวิดีโอก่อนครับ สิ่งที่ทำให้ Gemini Omni น่าสนใจ ไม่ใช่แค่การบอกว่า AI สร้างวิดีโอได้ แต่คือการที่ Google กำลังพา AI ไปสู่จุดที่ผู้ใช้สามารถนำสิ่งที่มีอยู่แล้ว ไม่ว่าจะเป็นภาพ เสียง คลิปวิดีโอ หรือคำอธิบายสั้น ๆ […]