Hugging Face #2 การใช้งาน AI Model บน Spaces ของแพลตฟอร์ม

สวัสดีค่ะทุกท่าน^^ จากบทความ #1 ที่เราได้ลองสร้าง Line Chatbot ด้วยการเชื่อม AI โมเดลใน Hugging Face เข้ากับ Make.com แบบ Step-by-Step ซึ่งโมเดลที่นิกเลือกให้เพื่อนๆ ใช้ในบทความ #1 เป็นโมเดลที่สามารถเชื่อมต่อได้ตามปกติ (พูดง่ายๆ ค่ะว่าเลือกมาแล้วว่าโมเดลนี้ใช้เชื่อมต่อกับแพลตฟอร์มภายนอกได้)

แต่ถ้าหากเราเปลี่ยนเป็นเลือกโมเดลใหม่ที่พอกด Run ปุ๊บแล้วสิ่งที่เกิดขึ้นคือ Error 404 not found บลาๆ อะไรซักอย่าง นั่นหมายความว่าโมเดลนี้ ไม่ได้เปิด Service API เอาไว้ให้เรียกใช้งานจากภายนอก พูดง่าย ๆ ก็คือ “โมเดลตัวนั้นไม่อนุญาตให้แพลตฟอร์มอื่นเข้าถึงโดยตรง” ดังนั้นจึงทำให้การเชื่อมต่อกับ Make.com ไม่สามารถทำงานได้ ซึ่งข้อผิดพลาดนี้ไม่ได้มาจาก Make.com หรือตัวผู้ใช้อย่างเรา

Hugging Face, Nick Panaya Sudta,
Hugging Face Spaces AI Model

Hugging Face Spaces คือพื้นที่ที่รวมเอาโมเดล AI มานำเสนอในรูปแบบแอปพลิเคชัน พร้อมหน้าตา UI ที่ใช้งานได้ทันที
ซึ่ง Developer จะสร้างแอปเหล่านี้ผ่านเครื่องมืออย่าง Streamlit หรือ Gradio ที่เป็น Lib ของ Python สำหรับสร้างหน้า GUI จากนั้นก็อัปโหลดขึ้น Spaces เพื่อให้ User ทั่วไปเข้ามาทดลองใช้งานกันได้ และทั้งนี้ถ้าเราใช้เป็น Plan Free จะได้รับพื้นที่ Private Storage ขนาด 1 GB ซึ่งโดยส่วนตัวนิกคิดว่าเพียงพอสำหรับการทดลองใช้งานทั่วไปได้แบบชิลๆ

Hugging Face, Nick Panaya Sudta,
Hugging Face Spaces AI Model
https://huggingface.co/spaces

แต่ในบทความนี้ นิกจะยังไม่สอนสร้างโมเดลเองนะคะ จะเน้นที่การทดลองใช้งานโมเดลที่มีอยู่แล้วก่อน เพื่อให้เข้าใจหลักการ และสามารถนำไปประยุกต์ใช้ให้เข้ากับ Task ของแต่ละท่าน แต่ละแบรนด์ ได้

มาเริ่มต้นใช้งาน Spaces ได้ง่ายๆ ตามขั้นตอนต่อไปนี้เลยค่ะ

  1. เข้าไปที่ https://huggingface.co/
  2. หรือหากท่านใดยังไม่มี User ก็สามารถเข้าไปที่ บทความ#1แล้วสมัครเข้าใช้งานตามขั้นตอนในนั้นได้เลยค่ะ
  3. เมื่อ Login เสร็จแล้ว ให้กดเข้าไปที่เมนู “Spaces” ทางด้านบนของหน้าเว็บ

โดยในตัว Spaces ก็จะมีโมเดลอยู่หลายหมวดหมู่ด้วยกัน เช่น การสร้างภาพ การสร้างข้อความ การวิเคราะห์ข้อความ การวิเคราะห์เสียง การแก้ไขรูปภาพ การสร้างโค้ด การถามตอบ การแสดงข้อมูล การโคลนเสียงของเรามาบรรยาย (ซึ่งเดี๋ยววันนี้เราจะมาเล่นส่วนนี้กันด้วย) การวิเคราะห์เอกสาร การทำ OCR การทำแชทบอท(ซึ่งเราทำไปแล้วในบทความแรก) การสร้างเพลง การวิเคราะห์ภาพทางการแพทย์ การทำระบบแนะนำ(ส่วนนี้นักการตลาดควรใช้)  การสร้าง Dataset etc…. ( o=^•ェ•)o ┏━┓ ซึ่งเราสามารถนำตัวโมเดลมาใช้งานได้

Hugging Face, Nick Panaya Sudta,
Hugging Face Spaces AI Model

โดยในบทความนี้ นิกจะพาทุกท่านไปใช้งานความสามารถของ AI Model บน Spaces (ซึ่งคิดว่าน่าจะเป็นประโยชน์โดยครอบคลุมทั้งสำหรับนักการตลาด/ Content creator/ นักเรียน/ Data Analyst  และ User ที่สนใจด้าน AI ทุกท่าน) ดังนี้ค่ะ

  • การทำ Sentiment Analysis: วิเคราะห์อารมณ์จากข้อความ
  • Image Models ต่างๆ ได้แก่
    • Object Detection
    • Food Calories Detection
    • Skin Analyzer
  • การตรวจจับท่าทาง (Pose Detection) และการสร้าง Dataset
  • อ่านใบเสร็จด้วย AI (Receipt OCR)
  • การสร้างภาพสไตล์การ์ตูน/ สร้างวิดีโอจากภาพนิ่ง
  • Voice Cloning: โคลนเสียงของเราให้พูดข้อความใหม่ได้

โดยโมเดลแรกที่นิกอยากให้ลองคือหมวด Sentiment Analysis ซึ่งก็คือการวิเคราะห์ว่าข้อความที่ลูกค้าของเราพิมพ์โต้ตอบเข้ามาที่แบรนด์มีอารมณ์อย่างไร จะเป็น…..

😊 Positive (เชิงบวก)
😐 Neutral (เป็นกลาง)
😡 Negative (เชิงลบ)

ซึ่งทุกท่านสามารถค้นหาในหน้า Search ของ Spaces โดยพิมพ์คำว่า “Sentiment Analysis” แล้วเลื่อนมาประมาณช่วงกลางๆ หน้า จะเจอโมเดลชื่อ JigsawStack/sentiment-analysis (แต่ถ้าเพื่อนๆ หาไม่เจอให้ Copy ชื่อโมเดลนี้ไปวางได้เลยนะคะ) ให้เลือกเป็นโมเดลนั้นไปค่ะ

Hugging Face, Nick Panaya Sudta,
Hugging Face Spaces AI Model,
sentiment-analysis

และตัวที่น่าสนใจอีกตัวหนึ่งก็จะเป็นตัว LLMs ที่ชื่อว่า Thai Sentiment Analysis ซึ่งตัวนี้เพื่อนๆ ก็สามารถลองเล่นได้เลย

3.1 Object Detection: การตรวจจับวัตถุ

โมเดลแรกที่นิกจะพาทุกท่านไปทำความรู้จักคือ AI Model ยอดนิยมอย่าง YOLO11 (atalaydenknalbant/Yolo11) และ YOLO13 Small Object Detection (fcakyon/sahi-yolox)

Hugging Face, Nick Panaya Sudta,
Hugging Face Spaces AI Model,
Yolo11, Object detection, Pose

ซึ่งเหมาะสำหรับงานที่ต้องการตรวจจับวัตถุขนาดเล็กในภาพ เช่น ตรวจหาสินค้าในสายการผลิต หรือระบุวัตถุในภาพถ่ายจำนวนมาก แถมก่อนรันโมเดล เราสามารถเรียกดู “ผลการรันล่าสุด” ของคนอื่นเพื่อประเมินความแม่นยำก่อนจะใช้โควต้าของตัวเองได้ด้วยค่ะ^^

Hugging Face, Nick Panaya Sudta,
Hugging Face Spaces AI Model,
Yolo11, Object detection, Pose

3.2 Food Calories Detection:  ตรวจนับแคลอรีอาหาร

โมเดลนี้เหมาะมากกับสายรักสุขภาพ หรือแบรนด์ที่ต้องการสร้าง Service ให้ลูกค้าทางด้านนี้ เพราะสามารถ อัปโหลดรูปอาหาร ผ่านหน้า UI หรือ เปิดกล้อง Webcam เพื่อให้โมเดลวิเคราะห์และคำนวณปริมาณแคลอรี่ได้

Hugging Face, Nick Panaya Sudta,
Hugging Face Spaces AI Model,
Food Calories Detection
https://huggingface.co/spaces/harrispatil/food_calorie_detector

รวมถึงสามารถปรับปรุงส่วนของค่า confidence ของโมเดล เช่นลดให้น้อยลงหน่อยเพื่อให้สามารถเจอสิ่งที่เราต้องการ ในที่นี้คืออาหารประเภทต่างๆ จากในรูปให้เยอะขึ้นได้

3.3 Skin Analyzer: วิเคราะห์คุณภาพผิวหน้า

เป็นอีกหนึ่งโมเดลที่เหมาะกับสายบิวตี้ (pratikskarnik/face_problems_analyzer) ทั้งใช้เองกับในส่วนของแบรนด์ที่สร้างเป็น Service ด้าน Skin care ให้ User ค่ะ
โดยเราสามารถใช้งานได้เพียงอัปโหลดรูปใบหน้าเข้าไป (แนะนำให้ถ่ายใกล้ ๆ หน่อยนะคะ)

ซึ่งสิ่งที่เราต้องทำก็คือ Upload เป็นภาพใบหน้าเข้าไป ผลลัพธ์จะได้การวิเคราะห์ออกมาเป็นเปอร์เซ็นต์ เช่น

  • ความมันของผิวกี่เปอร์เซ็นต์
  • ความแดง (Redness) กี่เปอร์เซ็นต์
  • ฝ้า กระ หรือจุดด่างดำ กี่เปอร์เซ็นต์
Hugging Face, Nick Panaya Sudta,
Hugging Face Spaces AI Model,
Face Skin Analyser, Skin Analyser
https://huggingface.co/spaces/pratikskarnik/face_problems_analyzer

และโดยสรุปถ้ายสุดโมเดลจะดึงปัญหาหลัก 3 ปัญหาของผิวหน้ามาให้เราค่ะ^^

โดย AI Model ตัวต่อไปที่นิกอยากแนะนำให้ทุกท่านรู้จะเป็นตัว Yolo11 โดยตัวนี้เบื้องต้นจะใช้เป็น Dataset ของ Cocodataset แต่ความเท่คือเราสามารถใช้ Webcam จากกล้อง Computer ของเราถ่ายรูปที่เราต้องการเพื่อไปทำ Dataset ของตัวเองได้ด้วยค่ะ

และจากภาพ หรือท่าทางที่เรา Add เข้าไป เราสามารถใช้เป็นตัว Yolo Pose เพื่อ Detect พวกท่าทาง โดยเริ่มแรก Model จะมีการตรวจจับแบบ Yolo ธรรมดาว่า Object นั้นเป็นอะไร แล้วตรวจจับในเรื่องของ Pose หรืออิริยาบทต่างๆ

Hugging Face, Nick Panaya Sudta,
Hugging Face Spaces AI Model,
Yolo11, Object detection, Pose
https://huggingface.co/spaces/sitammeur/YoloPose

ซึ่งในส่วนนี้เราก็สามารถทำในเรื่องการรู้จำอิริยาบทได้ สำหรับโปรเจคประเภทฟิตเนส หรือ Human Tracking  หรืองานสายสุขภาพต่างๆ ค่ะ

และโมเดลที่น่าสนใจอีกตัว ซึ่งคิดว่าน่าจะเป็นประโยชน์สำหรับท่านใดก็ตามที่ต้องการทำ Service ด้านรายรับรายจ่าย หรือเราเป็นร้านค้าที่ต้องการบริหารจัดการในภาคส่วนนี้

ซึ่งนั่นก็คือ AI Model (kawaiipeace/vms-fleet-receipt-reading)ที่ช่วยในเรื่องของการอ่านใบเสร็จ โดยผลลัพธ์จากโมเดลนี้จะสามารถแปลงข้อความที่อยู่ในใบเสร็จได้ เช่น พวกใบเสร็จค่าไฟ ใบเสร็จค่าน้ำประปา เป็นต้น

Hugging Face, Nick Panaya Sudta,
Hugging Face Spaces AI Model,
Receipt OCR, OCR
https://huggingface.co/spaces/kawaiipeace/vms-fleet-receipt-reading

การใช้งานก็ง่ายๆ คือ พอ Upload รูปแล้ว ก็ให้เรากด “ประมวลผลใบเสร็จ” ได้เลย แล้วรอผลลัพธ์ได้เลย

มาถึงโมเดลเอาใจสาย Content Creator ที่ช่วยเราสร้างภาพ และสร้างวิดีโอกันบ้างค่ะ

โดยโมเดลแรกที่นิกอยากแนะนำให้ทุกท่านลองคือ AI Model ที่ชื่อว่า EasyChibli ที่จะเปลี่ยนภาพจริงของเราให้กลายเป็นภาพการ์ตูนแนว Chibli (คล้ายสตูดิโอจิบลิ) ซึ่งการใช้งานง่ายมาก เพราะเราสามารถใช้รูปที่ถ่ายผ่านกล้อง Webcam ได้เลย แล้วก็หลังจากนั้นไม่ต้องทำอะไรเลยค่ะ ตัวโมเดลนี้ก็จะสร้างภาพที่เป็นภาพการ์ตูนสไตล์ Chibli ออกมาให้เราได้ทันที

Hugging Face, Nick Panaya Sudta,
Hugging Face Spaces AI Model,
Chibli, Image Model

และอีกโมเดลที่น่าสนใจสำหรับกลุ่มนี้ จะเป็นส่วนของการสร้างวิดีโอ ซึ่งสิ่งที่เราจะป้อนให้ AI Model จะมี 2 อย่าง

  • ด้านซ้ายคือ ภาพนิ่งที่ไม่ได้เคลื่อนไหว(เป็นตัว Source)
  • ด้านขวาให้ป้อนภาพเคลื่อนไหว(โดยเราอาจใช้ภาพตัวอย่างที่โมเดลมีไว้ให้ก็ได้)
Hugging Face, Nick Panaya Sudta,
Hugging Face Spaces AI Model,
Video Creation, Live Portrait
https://huggingface.co/spaces/KwaiVGI/LivePortrait

แล้วตัวโมเดลจะเอาภาพเคลื่อนไหวมา Sync กับด้านซ้าย โดยผลลัพธ์ที่ได้จะได้คนทางภาพนิ่ง มาทำ movement ตามแบบของด้านขวา การใช้งานก็ง่ายๆ ค่ะคือให้เรา Upload ข้อมูลทั้ง 2 ส่วนแล้ว ก็สามารถกด Process ได้เลย^^

และโมเดลใน Hugging Face Spaces ตัวสุดท้ายในบทความนี้ที่นิกอยากแนะนำให้ทุกท่านรู้จัก และคิดว่าเพื่อนๆ น่าจะชอบกันก็คือโมเดล Voice Cloning ที่จะเป็นการโคลนเสียงของเราให้พูดข้อความใหม่ค่ะ

โดยโมเดลนี้จะให้เราบันทึกเสียงต้นฉบับก่อน โดยกดปุ่มไมโครโฟนแล้วพูดอะไรก็ได้เข้าไป จากนั้นพิมพ์ข้อความที่ต้องการให้เสียงนั้นพูด แล้วกด Generate Speech

Hugging Face, Nick Panaya Sudta,
Hugging Face Spaces AI Model,
Voice Cloning, Speech Generator
https://huggingface.co/spaces/mrfakename/MegaTTS3-Voice-Cloning

ระบบจะสร้างเสียงใหม่ที่พูดตามข้อความที่เราป้อนเข้าไป (แต่ตอนนี้ระบบยังไม่รองรับภาษาไทยนะคะ ต้องรอในส่วนของผู้พัฒนากันต่อไป)

Panaya Sudta,
Nick, 
นิก ปณยา สุดตา

และทั้งหมดนี้คือบทความ #2 ที่พาทุกท่านเดินทางสำรวจ AI Model ที่อยู่ใน Hugging Face Spaces พื้นที่ที่ให้เราได้ทดลองใช้ AI Model ได้ง่ายๆ โดยไม่ต้องเขียนโค้ดใดๆ ทั้งสิ้น ตั้งแต่การวิเคราะห์อารมณ์ข้อความ การตรวจจับวัตถุในภาพ ไปจนถึงการโคลนเสียงพูดของตัวเอง ซึ่งทุกอย่างเกิดขึ้นได้ภายในการ Click mouse ไม่กี่ครั้ง

ซึ่งสำหรับนิกเองมองว่า Spaces เป็นเหมือนประตูบานแรก ที่พาเราเข้าสู่โลกของ AI ได้อย่าง Friendly สุดๆ ทำให้เราได้ทั้งไอเดีย และผลลัพธ์ไปพร้อมๆ กัน^^

Hi, I am Nick,,,,Panaya Sudta (●'◡'●) Engineer during the daytime. Researcher at night. Reader in spare time. (❁´◡`❁) วิศวกร/นักวิจัย/ Market research ค่ะ หวังเป็นอย่างยิ่งว่าจะได้แชร์มุมมองกันนะคะ

Leave a Reply

Your email address will not be published. Required fields are marked *