Generative AI กำลังเปลี่ยนโลก!! 🔥 ถ้าจะกล่าววลีนี้สำหรับสถานการณ์ในปัจจุบันคงไม่เกินจริง เมื่อ ChatGPT เข้ามาเปลี่ยนแปลง User Experience ให้ทุกคนเข้าถึงการใช้งาน AI จนสั่นสะเทือนทั้งวงการ และตอนนี้มีผู้เล่นรายใหม่ที่ชื่อเท่คือ DeepSeek จากค่ายจีนเข้ามาเขย่าตำแหน่งผู้ปลุกกระแสนั้น แต่ท้ายสุดแล้วจะสามารถแข่งขันกับ ChatGPT ที่ได้รับความนิยมอย่างกว้างขวางได้หรือไม่? จะเหมาะกับการใช้งานประเภทใดกันแน่?
เรามาหาคำตอบไปพร้อมๆ กันในบทความนี้ค่ะ เพราะนิกจะชวนทุกท่านมาเจาะลึกการ GenAI Fight ครั้งนี้และดูว่าใครจะได้ชัยชนะ 🏆 Let’s go ==>
#1 สรุปย่อ DeepSeek และ ChatGPT คืออะไร?
DeepSeek: เป็น Genrative AI จากบริษัท AI ของจีนที่เชี่ยวชาญด้านโมเดลภาษาขนาดใหญ่ (LLM) ซึ่งคล้ายกับ ChatGPT ของ OpenAI และ Gemini ของ Google โดยบริษัทได้รับความสนใจจาก DeepSeek LLM ซึ่งประกอบด้วยโมเดลที่ได้รับการปรับให้เหมาะสมสำหรับการใช้เหตุผล การสร้างโค้ด และการทำความเข้าใจภาษาธรรมชาติ (Natural Language) ซึ่ง DeepSeekAI เป็นบริษัทสตาร์ทอัพด้าน AI ของจีนที่ก่อตั้งในปี 2023 ได้รับความนิยมอย่างมากในช่วงไม่กี่วันที่ผ่านมา รวมถึงติดอันดับแอปฟรีอันดับหนึ่งบน App Store ของ Apple
ChatGPT: ครองพื้นที่ AI ด้วยการสื่อสารเชิงเชิงลึก ฐานความรู้ที่มีลักษณะเฉพาะ และการช่วยเหลือในการวิเคราะห์ข้อมูลที่ซับซ้อน ช่วยสร้างและ edit code ได้ ซึ่งสำหรับนิกมองว่าปัจจุบันใช้งานได้ดีมากกกก แบบ ก.ไก่ ล้านตัวค่ะ (คหสต.)
#2 ความแตกต่างหลักๆ
DeepSeek: เน้นที่ประสิทธิภาพ มีการปรับใช้แบบน้ำหนักเบา (หมายความว่าหากเราจะพ่วงกับ Services อื่นๆ จะสามารถทำได้ดีขึ้น) และเป็น AI แบบโอเพนซอร์ส (Host ได้ด้วยตัวเอง เช่น LLaMA, Mistral) ที่มีประสิทธิภาพค่อนข้างดี โดยจะเน้นที่การสื่อสารผ่านข้อความเป็นหลัก (ไม่มีความสามารถ Multi mode ในตัว)
ChatGPT: โดดเด่นในด้านการสนทนาที่เป็นธรรมชาติมากๆ คล้ายการสื่อสารกับมนุษย์ที่เป็นผู้เชี่ยวชาญ การเขียนโค้ด และการใช้เหตุผล ตลอดจนมีความสามารถในการวิเคราะห์ข้อมูล ซึ่งทำได้ดีมากๆ ในภาษาไทย แต่ไม่เป็นโอเพนซอร์ส (ต้องใช้ OpenAI API หรือสมัครใช้งาน ChatGPT Plus)
Gemini: Multi task model ทั้งการจัดการข้อความ รูปภาพ วิดีโอ และการใช้เหตุผลที่ซับซ้อน ที่สำคัญออก internet ได้ ไม่เป็นโอเพนซอร์ส แต่สามารถผสานรวมกับบริการของ Google ได้
#3 เปรียบเทียบความต่างของโมเดล
สิ่งสำคัญที่เราจะไม่พูดถึงไม่ได้คือเรื่องของ “Model Architecture ” ค่ะ ^^ โดยการที่เราเข้าใจความแตกต่างทางสถาปัตยกรรมที่สำคัญของโมเดลระหว่าง DeepSeek-R1 และ ChatGPT o1 ด้วยการสำรวจวิธีการออกแบบโมเดลเหล่านี้ จะทำให้เราสามารถเข้าใจจุดแข็ง จุดอ่อน และความเหมาะสมสำหรับงานต่างๆ เพื่อประยุกต์ใช้กับความต้องการของเราได้อย่างเหมาะสมมากยิ่งขึ้นนั่นเองค่ะ
🔹DeepSeek-R1 :
Mixture-of-Experts Architectureญ (MoE) : ใช้พารามิเตอร์ 671 พันล้านตัว แต่เปิดใช้งานเพียง 37 พันล้านตัวต่อการค้นหาหนึ่งครั้ง ซึ่งส่วนนี้เองที่ช่วยเพิ่มประสิทธิภาพในการคำนวณให้รวดเร็วมากยิ่งขึ้น
Reinforcement Learning Post-Training (RL ) : ปรับปรุงการใช้เหตุผลโดยไม่ต้องพึ่งพาชุดข้อมูลที่ต้องเตรียมมาเพื่อ Train model แบบหนักหน่วง ช่วยให้สามารถแก้ปัญหาแบบ “chain-of-thought (ห่วงโซ่แห่งความคิด)” ได้เหมือนมนุษย์
Cost effective Training: ใช้เวลา Train Model เป็นเวลา 55 วันบน GPU Nvidia H800 จำนวน 2,048 ตัว ด้วยต้นทุนเพียง 5.5 ล้านเหรียญสหรัฐฯ ซึ่งน้อยกว่าค่าใช้จ่ายของ ChatGPT ถึง 1 ใน 10 ส่วน!!
🔹ChatGPT o1:
Dense Model Architecture : การออกแบบแบบโมโนลิธิกที่มีพารามิเตอร์ 1.8 ล้านล้านตัวที่ได้รับการปรับให้เหมาะสมเพื่อความหลากหลายในการสร้างภาษาและงานสร้างสรรค์
Advanced Chain-of-Thought Processing : โดดเด่นในด้านการใช้เหตุผลแบบหลายขั้นตอน โดยเฉพาะอย่างยิ่งในสาขา STEM เช่น คณิตศาสตร์และการเขียนโค้ด
Proprietary Training: สร้างขึ้นบนกรอบงาน GPT-4o ของ OpenAI ซึ่งต้องใช้ทรัพยากรการคำนวณจำนวนมาก (ต้นทุนการฝึกอบรมประมาณ 100 ล้านดอลลาร์ขึ้นไป)
หลังจากที่ทุกท่านทราบความต่างเบื้องต้นระหว่าง Generative AI ทั้ง 2 ตัวนี้เแล้ว,,,, เรามาทดลองเปรียบเทียบความแตกต่างของการใช้งานกันค่ะ
Start =>> ให้เพื่อนๆ เข้าไปที่ https://www.deepseek.com เพื่อเข้าใช้งาน ซึ่งหลังจากที่เข้าไปแล้ว ก็จะพบกับหน้านี้ค่ะ
ก็สามารถเลือกไปที่ “Start Now ” ได้เลย ซึ่งเมื่อเลือกไปแล้วก็จะมี pop-up ขึ้นมาให้เรา Log-in โดยในส่วนนี้นิกใช้เป็น “Sign in with Google Account ” ค่ะ ==> แล้วเราก็จะได้พบกับ “น้องวาฬ” ที่แนะนำตัวว่า “Hi, I’m DeepSeek. ”
เมื่อทุกท่านพร้อมแล้ว เรามาเริ่มทดสอบความสามารถ เปรียบเทียบระหว่าง “น้องวาฬ” กับรุ่นพี่เก๋าเกมอย่าง ChatGPT กันค่ะ^^
Prompt แรก (งานทั่วไป) นิกต้องการให้:
ช่วยเขียนโครงร่างสำหรับบทความที่อธิบายว่า LLM คืออะไรและทำงานอย่างไร ขอเริ่มต้นด้วยการทบทวนสิ่งที่ทุกคนรู้เกี่ยวกับ LLM เช่นอธิบายกับ GPT-3, BERT เป็นต้น โดยโครงร่างที่ได้จะต้องครอบคลุม ซึ่งแบ่งหัวข้อออกเป็นส่วนๆ ที่เข้าใจง่าย
ซึ่ง ผลลัพธ์ที่ได้ออกมาเป็นดังนี้ค่ะ: ฝั่งซ้ายมือ น้องวาฬ ร่างโครงร่างให้นิกออกมาเป็น 4 หัวข้อ ได้แก่ พื้นฐานของ LLMs, LLMs ทำงานอย่างไร, ข้อดีและข้อจำกัดของ LLMs และอนาคตของ LLMs โดยแต่ละหัวข้อหลักประกอบไปด้วย 2 หัวข้อย่อย ในแต่ละหัวข้อย่อยประกอบไปด้วย 3 หัวข้อจิ๋ว => ทุกท่านสังเกตเห็นอะไรไหมคะ?
สำหรับนิกสิ่งที่พบในการให้ DeepSeek ร่างโครงเรื่องก็คือการร่างออกมาเป็น Pattern ที่เหมือนๆ กันทั้งโครงร่าง
ในขณะที่ ChatGPT ร่างออกมาเป็น 8 หัวข้อหลัก ได้แก่,,,,บทนำ : อธิบายว่า LLM คือโมเดลการเรียนรู้ลึกที่ใช้ข้อมูลจำนวนมากเพื่อสร้างและเข้าใจภาษาทำความเข้าใจกับ LLM : อธิบายว่า LLM ใช้ข้อมูลขนาดใหญ่และโมเดลที่ซับซ้อนในการเรียนรู้ภาษาโครงสร้างของ LLM : พูดถึงการใช้ Neural Networks และ Transformer Architecture ในการฝึก LLM ตัวอย่างของ LLM : เช่น GPT-3 ที่เน้นการสร้างข้อความ และ BERT ที่เน้นการทำความเข้าใจภาษาการทำงานของ LLM : อธิบายกระบวนการ Pre-training และ Fine-tuningข้อดีและข้อเสีย : เช่น ความสามารถในการสร้างข้อความ และปัญหาความถูกต้องและการใช้ทรัพยากร อนาคตของ LLM : แนวโน้มการพัฒนาและการปรับปรุงในด้านความแม่นยำและความปลอดภัย และสรุป
ซึ่งรูปแบบโครงร่างของ ChatGPT ในแต่ละหัวข้อไม่ได้มีจำนวนหัวข้อย่อยที่เท่ากันอย่างชัดเจน
ทั้งนี้สำหรับนิกเอง (ย้ำว่าเป็น คหสต. นะคะ) มองว่าถ้าต้องการ Pattern ของโครงร่างสวยๆ “น้องวาฬ” จะทำได้ดีกว่า แต่ในส่วนของความลึก และครอบคลุมของเนื้อหาโครงร่าง ChatGPT ค่อนข้างครบถ้วนในมุมมองของนิกค่ะ
Prompt ในการงานคำนวณ (น้องๆ นักเรียนของนิก ถาม ChatGPT แบบนี้ประจำ):
ฉันต้องการคำนวณโมเมนตัมของลูกบอลที่ถูกขว้างด้วยความเร็ว 10 เมตรต่อวินาทีและมีน้ำหนัก 800 กรัม ฉันจำได้ว่าโมเมนตัมเกี่ยวข้องกับมวลและความเร็ว สูตรคือ ถ้าจำไม่ผิด โมเมนตัมเท่ากับมวลคูณด้วยความเร็ว ดังนั้น p = m * v ใช่ไหมนะ และมวลนี่มีหน่วยเป็นกรัมใช่ไหม หน่วยมาตรฐานของมวลในฟิสิกส์คือกิโลกรัม ดังนั้นฉันคงต้องแปลงกรัมเป็นกิโลกรัมก่อนหรือเปล่า
ส่วนนี้นิกพบกว่าผลลัพธ์หรือคำตอบที่เป็นตัวเลขสุดท้ายที่ได้จากทั้ง น้องวาฬ และพี่ ChatGPT คำนวณได้ถูกต้อง และได้ค่าเท่ากัน แต่ๆๆ ในส่วนของคำอธิบาย ChatGPT ค่อนข้างทำได้ดีกว่า และละเอียดมากกว่า
โดยในส่วนนี้จะทดลองเปรียบเทียบ DeepSeek กับ ChatGPT ด้วยการให้ช่วยเราเขียนโค้ดสำหรับเครื่องคิดเลขง่ายๆ โดยใช้ HTML, JS และ CSS ด้วย Prompt
ช่วยฉันเขียนโค้ดสำหรับเครื่องคิดเลขง่ายๆ โดยใช้ HTML, JS และ CSS
สิ่งที่เจอคือ Code ที่ได้จาก “น้องวาฬ” นิกต้อง edit เพิ่ม 2 ครั้ง แล้วถามจุดที่ต้องการแก้ไขนั้นไป ถึงจะได้โค้ดที่ถูกต้องสำหรับเครื่องคิดเลข แต่ความน่าสนใจคือ GUI ของเครื่องคิดเลขที่ได้ออกมาเรียบง่ายและน่ารักมาก ๆ ค่ะ
ในขณะที่ถึงแม้ว่าหน้าตาของเครื่องคิดเลขจาก ChatGPT ที่พอเอาไป deploy จริงจะค่อนข้างเรียบง่าย สมกับชื่อ “Simple Calculator” แต่ความว้าวก็คือ Code ที่ได้มาใช้ได้เลยในครั้งแรก โดยไม่ต้องแก้ไข !!
Last but not Least..
หลังจากทดสอบ Generative AI แชทบอททั้ง 2 ตัว เปรียบเทียบกัน นิกเชื่อว่าหลายๆ ท่านน่าจะได้เห็นจุดเด่น ของทั้งสองค่าย และจุดที่แตกต่างกันในเบื้องต้น ซึ่งคำถามสำคัญก็คือ แล้วเราควรเลือกตัวไหนล่ะ?
สำหรับนิก คำตอบไม่ได้เป็นอะไรที่ตายตัวค่ะ ขึ้นอยู่กับวัตถุประสงค์และลักษณะการใช้งานของเรา โดยนิกขออนุญาต Guide จากมุมมองส่วนตัวคร่าวๆ ดังนี้ เลือก DeepSeek หากเราต้องการ AI แบบโอเพนซอร์ส ที่ปรับแต่งได้สำหรับการโฮสต์ด้วยตนเองเลือก และเลือก ChatGPT หากเราต้องการ AI เชิงการโต้ตอบสนทนาที่ดี เหมาะกับ Chatbot ที่ต้องใช้ตอบลูกค้า รวมถึงหากเราต้องการความช่วยเหลือในการเขียนโค้ด หรือการใช้เหตุผลวิเคราะห์ข้อมูลต่างๆ
—Put the right GenAI(s) into the right job ค่ะ —