


เราสามารถใช้ข้อมูลมาทำ segmentation ได้จากหลายช่องทาง ได้แก่ Geographic (ทางภูมิศาสตร์ เช่น จังหวัด ภาค ระยะห่างจากสาขา), Demographic (ทางประชากรศาสตร์ เช่น เพศ อายุ สถานภาพการสมรส), Psychographic (ทางจิตวิทยา เช่น ความชื่นชม ความมั่นใจในตนเอง) และ Behavior (ทางพฤติกรรม เช่น สินค้าที่ซื้อ ความถี่ในการซื้อสินค้า)



เราสามารถหาข้อมูลตรงนี้ได้จากหลายวิธี ตั้งแต่การวิจัยการตลาด เช่น focus group, แบบสอบถาม จนไปถึงฐานข้อมูลลูกค้า เช่น ฐานข้อมูลการซื้อ ฐานข้อมูลสมาชิก เป็นต้น
ต่อไปนี้จะขอแนะนำคอนเซปที่นักวิเคราะห์หลายๆ คนมักจะใช้ในการทำ segmentation สำหรับ Big Data ต่างๆ
- R : ‘Recency’ – ซื้อครั้งล่าสุดเมื่อไหร่
- F : ‘Frequency’ – ซื้อบ่อยแค่ไหน
- M : ‘Monetary Value’ – ซื้อของราคารวมเท่าไหร่



สามารถดูรายละเอียดและวิธีเพิ่มเติมเกี่ยวกับ RFM ได้ที่นี่
RFM ถูกออกแบบมาในลักษณะที่ว่า R เป็นค่าที่สำคัญที่สุด รองลงมาด้วย F และ M ตามลำดับ ในการพยากรณ์การกลับมาซื้อของลูกค้าในอนาคต เช่น ลูกค้าที่เพิ่งซื้อไป ย่อมมีความน่าจะเป็นที่จะกลับมาซื้อสูงกว่าลูกค้าที่เคยซื้อของจำนวนมาก แต่เลิกซื้อมาแล้ว 10 ปี
ข้อดีของการใช้ RFM คือ ไม่จำเป็นต้องใช้ข้อมูลจำนวนมาก (สามารถใช้เพียงแค่ข้อมูล transaction data ที่มี ID) และยังสามารถวิเคราะห์ได้อย่างง่ายดาย ไม่จำเป็นต้องใช้โปรแกรมยากอะไร มีเพียง excel ก็มากกว่าที่จำเป็นแล้ว
เราจะเห็นร้านค้าปลีกหลายรายใช้ RFM เพื่อศึกษาว่า ลูกค้ามีลักษณะการซื้อเป็นอย่างไร และ ควรจะเลือกเจาะกลุ่มเป้าหมายใดก่อน
2) K-means Clustering
ในการทำ K-means นักวิเคราะห์จะต้องเลือกใส่ว่าอยากได้กี่ segment (หรือที่ในระบบจะเรียกว่า cluster) และจะใช้ตัวแปรใดบ้างเป็นตัวตัด segment จากนั้นเครื่องก็จะรันออกมาให้ว่า คนไหนอยู่ segment ไหน แล้วแต่ละ segment มีกี่คน
สามารถดูรายละเอียดและวิธีเพิ่มเติมเกี่ยวกับ K-means ได้ที่นี่
สิ่งที่ทำให้ K-mean แตกต่างกับ RFM คือ K-means สามารถใช้ตัวแปรใดๆ เป็นตัวแปรต้นก็ได้ เช่น เพศ ความถี่ในการซื้อ ความถี่ในการมาที่ร้านค้า จำนวนสินค้าในการซื้อ ฯลฯ ซึ่งทำให้เราสามารถมองได้หลายมิติมากกว่า RFM
อย่างไรก็ตาม การที่เราจะนำตัวแปรใดๆ มาใช้ใน K-means เราก็ควรจะพิจารณาด้วยว่า ตัวแปรนั้นมีความสำคัญหรือไม่ และเกี่ยวข้องกับการแบ่ง segment ของเราจริงๆ หรือไม่ นอกจากนี้ เนื่องจากตัวแปรต่างๆ อาจจะมี scale ที่แตกต่างกัน เช่น 0 ถึง 1 และ 500-1000000 ซึ่งจะทำให้การรันผลผิดเพี้ยนได้ ดังนั้นจึงจะต้องทำการคลีนดาต้าก่อนรัน
สำหรับเราแล้ว เราจะชอบรัน K-means กับประเภทสินค้าที่ลูกค้าซื้อ เช่น ซื้อสินค้าประเภทเดรสกี่ % จากการซื้อทั้งหมด สินค้าผู้หญิงกี่ % สินค้าผู้ชายกี่ % ฯลฯ เพื่อหา segment ของกลุ่มลูกค้า
แม้ว่า RFM และ K-means จะดูแตกต่างกัน เราจะชอบรันทั้งคู่แล้วเอามาเทียบกันว่า อ๋อ ลูกค้าที่อยู่ใน segment นี้ซื้อ RFM เป็นยังไง แล้วมี segment ไหนที่สำคัญ



เราเป็นทีมผู้เชี่ยวชาญด้าน Customer Analytics ที่ Davoy คุณสามารถกรอกรายละเอียดในแบบฟอร์มด้านล่าง หรือติดต่อเรา เพื่อรับคำปรึกษาครั้งแรก ฟรี !