ในยุค Digital Marketing ที่นักการตลาดต้องรับมือกับข้อมูลจำนวนมหาศาล จนหลายครั้งเกิดคำถามว่า “เราควรเริ่มจากอะไร ทำอะไรต่อ?” กับข้อมูลดิบในมือกันดี => CRISP-DM หรือ Cross Industry Standard Process for Data Mining คือขั้นตอนมาตรฐานที่จะมาช่วยพวกเรา จัดลำดับความคิดสำหรับการวิเคราะห์ข้อมูล หรือวิเคราะห์การตลาดเรื่องใดๆก็ตาม อย่างครบถ้วนเป็นประโยชน์ไม่ฟุ้งกระจายไร้จุดหมายปลายทาง เพื่อสร้างโอกาสให้ธุรกิจเติบโตค่ะ^^
CRISPDM หรือ Cross Industry Standard Process for Data Mining ซึ่งจริงๆ ก็ตามชื่อค่ะ ว่าเป็นกระบวนการมาตรฐานในการทำเหมืองข้อมูล (ที่เรียกว่า “ทำเหมืองข้อมูล” เพราะในยุคนี้ข้อมูลก็มีค่าเหมือนแร่ในสมัยก่อน เลยถูกเปรียบเทียบว่าการขุดหา Insight จากข้อมูล ก็เหมือนการทำขุดแร่นั่นเอง)
จาก raw data ของร้านนี้พบว่าข้อมูลแบ่งเป็น 2 ส่วนหลักๆ คือ ข้อมูลของลูกค้า แบบ Personal data และข้อมูลการซื้อสินค้าในแต่ละครั้ง ซึ่งมีรายละเอียดได้แก่ หมายเลขคำสั่งซื้อ จำนวนสินค้าที่ซื้อ ราคาต่อหน่วยสินค้าที่ซื้อ เบอร์โทรศัพท์ ชื่อของลูกค้า สถานที่จัดส่ง เป็นต้น
Transaction Data
#3 Data Preparation
เมื่อทำความเข้าใจข้อมูลแล้ว เราก็จะมาเข้าสู่ขั้นตอนที่ใช้เวลานานที่สุดของกระบวนการทั้งหมดกัน นั่นคือการเตรียมข้อมูล ซึ่งพบว่าข้อมูลของลูกค้าที่เป็น Personal Data ของร้านค้าออนไลน์ร้านนี้มีไม่ครบทุกรายค่ะ => ซึ่งขอบอกเลยว่าน่าเสียดายแบบตะโกน เพราะข้อมูลประเภทนี้ คือเป็นข้อมูลทรงคุณค่าที่เราควรนำมาใช้สุดๆ แต่!! เราทำอะไรไม่ได้ค่ะ ได้แต่ทำใจ แล้วตัดออกไปก่อน 😳😵 และมาดูข้อมูลในส่วนของ Transaction ซึ่งเป็นที่แน่นอนอยู่แล้วว่า พอเป็นข้อมูลที่เก็บมาแบบอัตโนมัติ จากทุกๆ ครั้งของการซื้อ ทำให้ข้อมูลครบถ้วนดี ไม่มี Missing Value สามารถนำไปใช้งานต่อได้เลย (แต่ถ้าอยากทำให้ละเอียดขึ้นให้พิจารณาพวก Outlier ด้วยค่ะ)
โดยในส่วนนี้เนื่องจากเราไม่นำข้อมูลส่วนตัวของลูกค้าแต่ละรายมาใช้ได้ วิธีที่(น่าจะ)เหมาะที่สุดสำหรับ data set ที่มีเพียงรายละเอียดของ transaction ก็คือ “RFM” model เจ้าประจำของเรานั่นเองงงง ซึ่งหน้าที่ของเราก็คือการคำนวณหา Feature R F และ M มาใส่ให้ครบค่ะ
หลักการคำนวณเพื่อหา Features R F และ M
สำหรับรายละเอียดของการทำ RFM นิกจะแปะ link ไว้ให้ด้านล่างของบทความนะคะ
#4-6 Modeling-Evaluation-Deploy
และเมื่อเราผ่านขั้นตอนที่ยาวนานมากที่สุดคือการทำ Data Preparation มาแล้วก็จะเข้าสู่การสร้าง Model เพื่อแบ่งกลุ่มลูกค้าตามที่เราต้องการ ซึ่งอย่างที่เกริ่นมาข้างบนค่ะว่า เราจะใช้เป็น RFM Model สำหรับชุดข้อมูลของร้านค้าออนไลน์ร้านนี้ในเบื้องต้น (และหากต้องการวิเคราะห์เพิ่มเติมหลังจากนั้นให้ลองทำ K-means Clustering ต่อได้นะคะ) โดยในส่วนของการ Evaluation ก็จะนำเอาข้อมูลกลุ่มลูกค้าที่แบ่งแล้วมาแปลความหมายของแต่ละกลุ่ม เพื่อประเมินความเหมาะสม ว่ากลุ่มที่แบ่งมามีความเหมาะสมหรือไม่ค่ะ
credit: codecrucks.com
ขั้นตอนสุดท้ายคือ Deploy การเอากลุ่มลูกค้าที่เราแบ่งมาได้ไปทำ CRM ต่อให้เหมาะสม พร้อมกับการทำ Data Visualization ในรูปแบบของ Dashboard เพื่อให้ง่ายต่อความเข้าใจ ก็จะเป็นการเสร็จกระบวนการ Cross Industry Standard Process for Data Mining อย่างสมบูรณ์ 😀😊
Hi, I am Nick,,,,Panaya Sudta (●'◡'●)
Engineer during the daytime. Researcher at night. Reader in spare time. (❁´◡`❁) วิศวกร/นักวิจัย/ Market research ค่ะ หวังเป็นอย่างยิ่งว่าจะได้แชร์มุมมองกันนะคะ