สวัสดีค่ะทุกท่าน,, เมื่อ 2 วันที่ผ่านมา Google ได้เปิดตัว Google VEO2 รวมถึงอัปเดต Imagen 3 และทดสอบ Whisk โมเดลตัวใหม่ล่าสุดของ Gemini ซึ่งต้องบอกเลยค่ะว่า Google ได้สร้างกระแสในวงการ AI อีกครั้งจากการเปิดตัว VEO 2 ในครั้งนี้ ที่จะมาปฏิวัตวงการ Video Generator ให้ง่าย และสมจริงมากยิ่งขึ้นไปอีก โดยหลังจากที่เปิดตัว VEO 2 ก็ได้รับความสนใจจากผู้ใช้จำนวนมาก ในฐานะที่มีศักยภาพในการสร้างคอนเทนต์(ที่ว่ากันว่าสามารถ)เปลี่ยนแปลงโลก!!
แล้วชาวการตลาดวันละตอน อย่างพวกเราจะตกขบวนไปได้อย่างไรคะ 😎😁 ในบทความนี้นิกเลยจะขออนุญาตพาทุกท่านไปทัวร์ชมเบื้องลึก เบื้องหลัง และการใช้งาน Google VEO 2 พร้อมเปรียบเทียบกับคู่แข่งเจ้าตลาดรายสำคัญอย่าง Sora จากค่าย OpenAI เจ้าเก่ากัน^^
โดยความว้าวแรกที่นิกจะเล่าให้อ่านกันก็คือเจ้า VEO 2 เนี่ยสามารถสร้างวิดีโอภาพยนตร์ 4K ที่มี “Realistic physics ” หรือพูดง่ายๆ ว่ามีการเคลื่อนไหวที่เป็นธรรมชาติมากยิ่งขึ้น ซึ่งส่วนนี้รวมถึงการแสดงออก/แสดงสีหน้าท่าทางของมนุษย์ ทำให้จุดนี้เองที่ถือเป็นก้าวสำคัญในการสร้างวิดีโอด้วย AI
โดยเฉพาะอย่างยิ่งเมื่อรวมกับ Imagen 3 ซึ่งเป็นเหมือนเครื่องมือสร้างรูปภาพที่ถูกอัปเกรดแล้วให้สามารถ Create ภาพที่สมจริงและสวยงามได้มากขึ้น โดยสามารถจัดการกับสไตล์ที่หลากหลายได้อย่างครอบคลุม และสามารถจับภาพพื้นผิวและแสงได้อย่างแม่นยำยิ่งขึ้น กอปรกับมี Whisk (ตัวทดสอบ) ที่ทำการรีมิกซ์ภาพได้โดยไม่ต้องใช้คำสั่งข้อความที่ซับซ้อน อีกทั้งยังช่วยให้เราสร้างภาพโดยใช้ภาพอื่นๆ เป็นคำสั่งแทนการพิมพ์คำอธิบายโดยละเอียดได้ด้วย ส่งผลให้เราสามารถกล่าวแบบไม่อวยได้เลยค่ะว่า Google ได้เข้ามาเป็นหนึ่งในผู้นำเรื่องการสร้างภาพด้วย AI โดยนำเสนอ Tool ระดับมืออาชีพ สำหรับ User ทั่วไป ทำให้ใครๆ ก็สามารถเข้าถึงการสร้างวิดีโอคุณภาพสูงได้อย่างไม่ยากเลย
ความว้าวต่อไปคือฟีเจอร์ต่างๆ ของ VEO 2 ซึ่งมีรายละเอียดดังนี้
ความเข้าใจฟิสิกส์ของโลกแห่งความจริงและการเคลื่อนไหวของมนุษย์: VEO 2 สามารถสร้างวิดีโอที่มีความสมจริงมากขึ้น โดยใช้ความเข้าใจฟิสิกส์ของโลกแห่งความจริงและการเคลื่อนไหวของมนุษย์
ความละเอียดสูง: VEO 2 สามารถสร้างวิดีโอที่มีความละเอียดสูงถึง 4K
ความยาววิดีโอ: VEO 2 สามารถขยายลำดับให้มีความยาวหลายนาทีได้
รายละเอียดภาพ: VEO 2 สามารถสร้างรายละเอียดภาพที่สมจริงและสวยงามมากขึ้น โดยสามารถจัดการกับสไตล์ที่หลากหลายได้อย่างแม่นยำมากขึ้น และสามารถจับภาพพื้นผิวและแสงได้อย่างแม่นยำยิ่งขึ้น
ความเร็วในการสร้างวิดีโอ: VEO 2 สามารถสร้างวิดีโอได้เร็วขึ้น โดยใช้เทคโนโลยี AI
ความสามารถในการสร้างวิดีโอหลากหลายรูปแบบ: VEO 2 สามารถสร้างวิดีโอหลากหลายรูปแบบ เช่น วิดีโอสั้น วิดีโอยาว วิดีโอการ์ตูน วิดีโอสารคดี ฯลฯ
นอกจากนี้ VEO2 ยังมีคุณสมบัติอื่นๆ อีกมากมาย เช่น ความสามารถในการสร้างวิดีโอแบบ 360 องศา ความสามารถในการสร้างวิดีโอแบบอินเตอร์แอคทีฟ และความสามารถในการสร้างวิดีโอแบบเรียลไทม์
ว่าแล้วเราก็มาทดลองใช้งาน VEO 2 ตามขั้นตอนดังนี้กันได้เลยค่ะ (☞゚ヮ゚)☞
#ขั้นตอนการใช้งาน VEO2:
ลงทะเบียน: User ต้องลงทะเบียนเพื่อเข้าถึง VEO 2 ผ่าน Google Labs Video FX platform
สร้างคำสั่ง: เราสามารถสร้างคำสั่งเพื่อสร้างวิดีโอได้ โดยสามารถใช้คำสั่งภาษาอังกฤษหรือภาษาอื่นๆ
เลือกสไตล์: เราสามารถเลือกสไตล์ของวิดีโอได้ เช่น สไตล์ภาพยนตร์ สไตล์การ์ตูน สไตล์สารคดี ฯลฯ
ปรับแต่งวิดีโอ: เราสามารถปรับแต่งวิดีโอได้ เช่น เปลี่ยนสี เปลี่ยนแสง เปลี่ยนมุมกล้อง ฯลฯ
สร้างวิดีโอ: เมื่อเราพอใจกับการปรับแต่งแล้ว สามารถสร้างวิดีโอได้
ดาวน์โหลดวิดีโอ: เมื่อวิดีโอสร้างเสร็จแล้ว เราก็สามารถดาวน์โหลดวิดีโอได้ที่เราต้องการได้เลย
#ขั้นตอนการใช้งาน Imagen 3:
อัปโหลดภาพ: ให้เราทำการอัปโหลดภาพที่ต้องการแก้ไข
เลือกพื้นที่ที่ต้องการแก้ไข: โดยสามารถเลือกพื้นที่ที่ต้องการแก้ไขได้
เลือกสไตล์การแก้ไข: หลังจากนั้นให้เราเลือกสไตล์การแก้ไข เช่น สไตล์ภาพถ่าย สไตล์ภาพวาด สไตล์ภาพประกอบ ฯลฯ
แก้ไขภาพ: เมื่อเราเลือกสไตล์ที่เราต้องการแก้ไขแล้ว ก็สามารถแก้ไขภาพให้เป็นสไตล์นั้นได้
ดาวน์โหลดภาพ: และเมื่อภาพแก้ไขตามที่เราต้องการเสร็จแล้ว ก็สามารถดาวน์โหลดภาพได้เลย
ป.ล. หรือหากเพื่อนๆ ท่านใดใช้งาน Gemini อยู่แล้วก็สามารถใช้งานโดยการ Promoting ผ่าน Gemini โดยสั่งให้ Create by Imagen 3 ได้ด้วยค่ะ
โดยภาพด้านล่างนี้ Create จาก Prompt เดียวกัน: ภาพซ้ายใช้ Gemini 1.5 Flash ภาพขวาใช้ Imagen 3
#ขั้นตอนการใช้งาน Whisk:
อัปโหลดภาพ: อัปโหลดภาพที่ต้องการใช้เป็นคำสั่ง
เลือกสไตล์: เลือกสไตล์ของภาพที่ต้องการสร้าง
สร้างภาพ: หลังจากที่เลือกสไตล์แล้ว ก็สามารถสร้างภาพได้เลย
ดาวน์โหลดภาพ: เมื่อภาพสร้างเสร็จแล้ว ก็ถึงขั้นตอนการดาวน์โหลดภาพที่เราต้องการเป็นอันเสร็จเรียบร้อย
VIDEO
เปรียบเทียบความแตกต่างระหว่าง VEO2 กับ Sora: เครื่องมือสร้างวิดีโอ AI รุ่นใหม่
VEO2 และ Sora เป็น 2 Ai Tools ในบรรดาเครื่องมือสร้างวิดีโอ AI ที่ได้รับความสนใจอย่างมากในปัจจุบัน โดยทั้งคู่มีความสามารถในการสร้างวิดีโอที่สมจริงและน่าทึ่งมากๆ จากข้อความเพียงไม่กี่คำ อย่างไรก็ตาม ทั้งสองตัวมีจุดเด่นและจุดแตกต่างที่น่าสนใจ ดังนี้ค่ะ ^^
#VEO2 (พัฒนาโดย Google DeepMind)
จุดเด่น:
ความเข้าใจฟิสิกส์: VEO 2 มีความโดดเด่นในการเข้าใจฟิสิกส์ของโลกแห่งความจริง ทำให้วิดีโอที่สร้างขึ้นมีความสมจริงในแง่ของการเคลื่อนไหวของวัตถุ ปฏิสัมพันธ์ของแสง และเงา
ความหลากหลายของสไตล์: สามารถสร้างวิดีโอได้หลากหลายสไตล์ ทั้งภาพยนตร์ การ์ตูน หรือแอนิเมชัน
ความละเอียดสูง: สร้างวิดีโอได้ในความละเอียดสูงถึง 4K
ความยาววิดีโอ: สามารถสร้างวิดีโอที่มีความยาวหลายนาทีได้
จุดสังเกต:
เน้นความสมจริง: VEO 2 มุ่งเน้นไปที่การสร้างวิดีโอที่ดูสมจริงและเป็นไปได้ในโลกแห่งความจริง
ยังอยู่ในขั้นตอนการพัฒนา: ฟีเจอร์และความสามารถอาจมีการปรับปรุงเพิ่มเติมในอนาคต
#Sora (พัฒนาโดย OpenAI)
จุดเด่น:
ความคิดสร้างสรรค์: Sora มีความสามารถในการสร้างสรรค์วิดีโอที่แปลกใหม่และไม่คาดคิดได้อย่างหลากหลาย
ความเข้าใจภาษา: สามารถเข้าใจภาษาธรรมชาติได้ดี ทำให้ผู้ใช้สามารถกำหนดคำสั่งได้ง่ายและหลากหลาย
ความเร็วในการสร้าง: สามารถสร้างวิดีโอได้ค่อนข้างเร็ว
จุดสังเกต:
เน้นความหลากหลาย: Sora มุ่งเน้นไปที่การสร้างวิดีโอที่มีความหลากหลายและไม่จำกัดรูปแบบ
ความสมจริงอาจยังไม่เท่า VEO 2: ในบางกรณี วิดีโอที่สร้างโดย Sora อาจยังไม่สมจริงเท่ากับวิดีโอที่สร้างโดย VEO 2
#สรุปความแตกต่าง
Tools VEO2 Sora ความสมจริง สูง ปานกลาง ความหลากหลายของสไตล์ สูง สูงมาก ความเข้าใจฟิสิกส์ สูง ปานกลาง ความเร็วในการสร้าง ปานกลาง สูง
ซึ่งขอสรุปสั้นๆ สำหรับผู้ที่ต้องการเลือกใช้งานให้เหมาะสมกับความต้องการดังนี้:
VEO 2 เหมาะสำหรับผู้ที่ต้องการสร้างวิดีโอที่มีความสมจริงสูง และต้องการควบคุมรายละเอียดต่างๆ ในวิดีโอ
Sora เหมาะสำหรับผู้ที่ต้องการสร้างวิดีโอที่แปลกใหม่ และมีความคิดสร้างสรรค์สูง และต้องการสร้างวิดีโอได้อย่างรวดเร็ว
การเลือกใช้ : กล่าวคือการเลือกใช้ VEO 2 หรือ Sora ขึ้นอยู่กับความต้องการและวัตถุประสงค์ในการใช้งานของแต่ละบุคคล หากต้องการสร้างวิดีโอที่เน้นความสมจริงและความแม่นยำ VEO 2 อาจเป็นตัวเลือกที่ดี แต่ถ้าต้องการสร้างวิดีโอที่แปลกใหม่และมีความคิดสร้างสรรค์ Sora อาจตอบโจทย์ได้ดีกว่าค่ะ
#ตัวอย่าง prompt สำหรับ VEO2 มีดังนี้:
สร้างวิดีโอสั้นๆ เกี่ยวกับการเดินทางไปยังสถานที่ท่องเที่ยวที่สวยงาม
สร้างวิดีโอสอนทำอาหารจานโปรดของเรา เช่น ข้าวมันไก่
สร้างวิดีโอ/วิดีโอเพลงแนะนำผลิตภัณฑ์ใหม่
สร้างวิดีโอเกม
นอกจากนี้ นอกจากนี้เรายังสามารถใช้ VEO 2 เพื่อสร้างวิดีโอประเภทอื่นๆ ได้อีกมากมาย ขึ้นอยู่กับความคิดสร้างสรรค์ของเรา และสำหรับตัวอย่าง prompt สำหรับ Image Inpainting 3 มีดังนี้:
ลบวัตถุออกจากภาพ
เติมพื้นที่ว่างในภาพ
แก้ไขสีสันของภาพ
ปรับปรุงรายละเอียดของภาพ
สร้างภาพใหม่จากภาพเดิม
ท้ายสุดเรามาดูกันที่ตัวอย่าง prompt สำหรับ Whisk ดังนี้ค่ะ:
สร้างภาพของแมวสีดำที่กำลังวิ่งเล่นบนหาดทราย
สร้างภาพของดอกไม้ที่กำลังบานสะพรั่ง
สร้างภาพของภูเขาไฟที่กำลังปะทุ
สร้างภาพของเมืองในอนาคต
สร้างภาพของสิ่งมีชีวิตในจินตนาการ
และแน่นอนค่ะว่าเราสามารถใช้ Whisk เพื่อสร้างภาพประเภทอื่นๆ ได้อีกมากมาย ขึ้นอยู่กับความคิดสร้างสรรค์ของเรานั่นเองค่ะ ^^
Last but not Least..
ป.ล. เทคโนโลยี AI สำหรับการสร้างวิดีโอยังคงพัฒนาอย่างต่อเนื่อง ทั้งในเรื่องของคุณสมบัติและความสามารถของทั้ง VEO2 และ Sora ที่อาจมีการเปลี่ยนแปลงไปในอนาคต ซึ่งเป็นประโยชน์มากๆ สำหรับ User และเหล่า Content Creator, Marketer ที่จะสามารถใช้ประโยชน์จาก Generative AI Tools เหล่านี้ได้ตามความต้องการ และความเหมาะสมกับลักษณะงาน
และสำหรับเพื่อนๆ สายลึกที่ต้องการอ่านเอกสารวิจัยเพิ่มเติม สามารถเข้าไปอ่านกันต่อได้ที่ =>>
https://deepmind.google/research/publications