Overfitting vs Underfitting คำที่ว่าด้วยปัญหาจากความซับซ้อนของข้อมูล
Overfitting vs Underfitting คำที่ว่าด้วยปัญหาจากความซับซ้อนของข้อมูล ในฐานะนักการตลาดสายดาต้าวัยเตาะแตะคนหนึ่ง การเข้ามาทำงานสายนี้ต้องประสบและพบเจอกับคำศัพท์แวดวงดาต้าใหม่ ๆ จำนวนมาก ทั้งเข้าใจก็ดี ไม่เข้าใจก็ดี อ่านแล้วก็งง ๆ เหมือนจะเข้าใจแต่ก็ไม่เข้าใจ นี่มันภาษาคนหรือภาษาเทพ!?! โดยในบทความนี้เราจะพามารู้จักกับ Overfitting และ Underfitting ที่คนทำดาต้าต้องเจอแบบฉบับเข้าใจง่าย ย้ำว่าแบบง่ายแสนง่าย อธิบายแบบภาษาคนคุยกับคน คนแบบเรา ๆ ชาวเราวัยดิจิทัลเตาะแตะ Overfitting คืออะไร? Overfitting เป็นปัญหาที่เกิดขึ้นเมื่อสถานการณ์ที่เกิดขึ้นเมื่อแบบจำลองทางสถิติหรือ Machine learning ทำงานได้ดี มีความแม่นยำสูง ทำนายแม่นกับ training data แต่ทำงานได้แย่ ไม่แม่นยำ เมื่อเจอข้อมูลใหม่ ๆ หรือ ข้อมูลที่ไม่เคยเห็นมาก่อน (testing data) เรียกง่าย ๆ ว่าโมเดลสามารถปรับตัวให้ตรงกับข้อมูลฝึกสอนได้ดีมากเกินไป จนทำให้ไม่สามารถทำนายข้อมูลใหม่ๆ ได้เท่าที่ควร นั่นหมายความว่าโมเดลอาจจะทำนายข้อมูลฝึกสอนได้แม่นยำ แต่ไม่สามารถทำนายข้อมูลจริงที่ไม่เคยเห็นมาก่อนได้ ซึ่งสิ่งนี้อาจทำให้โมเดลไม่มีคุณค่าในการใช้งานจริง เผื่อใครที่นึกภาพไม่ออก ขออธิบายแบบบ้าน ๆ อย่างนี้ค่ะ […]