เทคนิคดึงดูดลูกค้าในแบบ Netflix

เทคนิคดึงดูดลูกค้าในแบบ Netflix

10 กรกฎาคม 2563

สถานการณ์การแพร่ระบาดของเชื้อไวรัสโคโรนาสายพันธุ์ใหม่ที่ทำให้เกิดโรคโควิด-19 ไม่เพียงแค่ส่งผลกระทบโดยตรงต่อการใช้ชีวิตของคนทั่วโลก แต่ยังส่งผลให้เศรษฐกิจชะลอตัวลงอย่างหลีกเลี่ยงไม่ได้ สร้างแรงสั่นสะเทือนต่อบริษัทยักษ์ใหญ่เป็นจำนวนไม่น้อย  แต่ในทางกลับกัน Platform Streaming ชื่อดังอย่างเน็ตฟลิกซ์ (Netflix) กลับมียอด สมาชิกเพิ่มขึ้นถึง 15.77 ล้านคน และมีรายได้รวมเพิ่มขึ้นถึง 27.6% เมื่อเทียบกับช่วงเดียวกันของปีที่แล้ว

“More than 80% of what people watch comes from our recommendation.”

Netflix

นั่นเป็นเพราะเน็ตฟลิกซ์ได้มีการใช้เทคนิคทางด้านวิทยาศาสตร์ข้อมูล (Data Science) เข้ามาเกี่ยวข้อง โดยเน็ตฟลิกซ์ได้กล่าวว่า “More than 80% of what people watch comes from our recommendation.” ซึ่งถือว่าเป็นตัวเลขที่สูงมาก ๆ บทความนี้จะอธิบายเกี่ยวกับการใช้ Big Data ของเน็ตฟลิกซ์ ที่ทำให้เน็ตฟลิกซ์กลายเป็นระบบ streaming เบอร์ 1 ของโลกในยุคปัจจุบัน


ในปี พ.ศ.2549 ซึ่งบริษัทได้เริ่มเปิดตัวในสหรัฐอเมริกานั้น เน็ตฟลิกซ์มีจำนวนสมาชิกทั้งสิ้นประมาณ 6 ล้านคน  ก่อนจะเพิ่มจำนวนเป็นกว่า 100 ล้านในปี พ.ศ.2560 และให้บริการในกว่า 190 ประเทศ ถ้าคิดเป็นค่าเฉลี่ยแล้วเน็ตฟลิกซ์จะมีสมาชิกหน้าใหม่ปีละ 8.5 ล้าน ซึ่งเป็นการเติบโตที่รวดเร็วมาก และผมเองก็เป็นหนึ่งในลูกค้าของเน็ตฟลิกซ์เหมือนกัน

ผมไม่รู้ว่าเพื่อน ๆ เป็นแบบผมหรือเปล่า ที่น้อยครั้งมากที่จะมานั่งหาชื่อหนังที่จะดูโดยการพิมพ์ชื่อหนังเอาเองในช่องค้นหา เพราะโดยส่วนใหญ่แล้ว ถ้าผมอยากจะดูหนังอะไรสักเรื่องก็มักจะเลือกดูจากลิสต์หนังที่ทางเน็ตฟลิกซ์แนะนำมาให้ในหน้า Home ซึ่งทุกครั้งก็มักจะได้หนัง หรือ ซีรี่ย์ ที่สนุก ถูกใจจากลิสต์หนังพวกนั้นนี่แหละ

การที่จะแนะนำหนังให้ถูกใจลูกค้าไม่ใช่เรื่องง่ายเพราะ ถึงแม้จะมีทฤษฎีที่บอกว่า คนที่มีลักษณะทางประชากรคล้าย ๆ กันจะชอบอะไรคล้าย ๆ กัน แต่นั่นก็ไม่เสมอไป เพราะแต่ละคนก็จะมีความ Unique หรือ เอกลักษณ์รสนิยมของแต่ละบุคคล ด้วยเหตุนี้เน็ตฟลิกซ์เลยวางระบบ Personalize ที่ Unique ของแต่ละสมาชิกซึ่งแต่ละ Profile ของเน็ตฟลิกซ์จะเห็นอะไรที่แตกต่างกัน และ แน่นอนว่าผมไม่ได้กำลังพูดถึงแต่ลิสต์ของหนังที่แตกต่างกัน สิ่งที่แตกต่างกันยังมี

  1. การจัดลำดับ (Ranking) การเรียงหนังของแต่ละสมาชิกจะแตกต่างกัน โดยที่จะวางหนังที่คิดว่าสมาชิกนี้จะชอบที่สุดไว้ทางด้านซ้าย
  2. การวางโครงสร้าง (Structure) ของหน้าจอ จากบนลงล่าง จะมี Section ของหนังที่แตกต่างกัน
  3. การปรับงานศิลป์ให้ถูกจริตส่วนบุคคล (Personalized Artwork) กล่าวคือ แม้แต่ Artwork ก็ มีการ Personalize เคยสังเกตไหมว่าหน้าปกของหนังที่เราดู จะมีความแตกต่างกันบางครั้ง และ หน้าปกติใน profile ของเพื่อนมันแตกต่างกัน นั่นแหละ เพราะ Netflix มองว่าหน้าปกของหนังส่งผลต่อการตัดสินใจกับการดูของลูกค้า และ ลูกค้าแต่ละคนชอบปกหนังแตกต่างกัน ดังนั้นเน็ตฟลิกซ์พยายามเลือก Artwork ของปกหนังที่คิดว่าลูกค้าจะชอบที่สุด
  4. “เนื้อหาคัดสรรสำหรับคุณ” ข้อความที่เด้งขึ้นมาใน การแจ้งเตือนของเน็ตฟลิกซ์ก็เป็นการวิเคราะห์จาก Big Data ของหนังที่สมาชิกคนนั้นเคยดู และเพื่อเลือกหนังที่คาดว่าจะถูกใจสมาชิกคนนั้น ๆ
  5. Trending Now ของประเทศ นั้น ๆ เพื่อแสดงให้เห็นว่า Community หรือ สังคมนั้น ๆ กำลังนิยมรับชมอะไรกันอยู่บ้าง
ภาพนี้แสดงถึง Art Work ของหน้าปกหนัง ของซีรี่ย์เรื่อง Stranger Things อย่างที่เห็น แต่ละ Art Work แสดงถึงอารมณ์ของ ซีรี่ย์ที่แตกต่างกัน ดังนั้นแต่ละ Art Work ก็มีส่วนสำคัญ กับการเชิญชวนมาดูซีรี่ย์เรื่องนี้

จุดมุ่งหมายของระบบ Personalization หรือ Recommender System ของเน็ตฟลิกซ์คือเพื่อเพิ่มความพึงพอใจของสมาชิก โดยการช่วยสมาชิกค้นหาหนังที่ตัวจะชอบ  ซึ่งระบบนี้มันซับซ้อนกว่าที่เราคิด เพราะการที่จะวางโครงสร้างของแพลตฟอร์มให้สามารถเก็บข้อมูล สร้างระบบ Machine learning และทำการ Deploy ได้นั้นไม่ใช่เรื่องง่าย และหนึ่งในอุปสรรคที่ใหญ่คือเรื่องของเวลา

อุปสรรคที่ใหญ่ของการพัฒนาระบบ Personalization หรือ Recommender System คือเรื่องของเวลา

เวลาทำให้อะไรหลาย ๆ อย่างไม่แน่นอน ยกตัวอย่างเช่น พฤติกรรรมการดูหนังของสมาชิก ดังนั้นการวางระบบ Personalize ให้ปรับตามการเปลี่ยนแปลงต่าง ๆ บนแพลตฟอร์มของเน็ตฟลิกซ์ถือเป็นโจทย์ที่ใหญ่ เน็ตฟลิกซ์ได้วางระบบที่จะมีการ Train โมเดลในออฟไลน์ ตามมาด้วย A/B Testing บนออนไลน์ การทำ A/B Testing เป็นกระบวนการที่ทดสอบว่า สมาชิก จะชอบ การแนะนำหนังแบบไหน Art work แบบไหน มากที่สุด เพื่อนำมาปรับปรุงตัวโมเดลเรื่อย ๆ หลังจากใช้งานจริง

วงจรนวัตกรรม (Innovation Cycle) ของระบบ Personalization ของเน็ตฟลิกซ์ตั้งแต่ร่างไอเดียไปจนถึง Deployment เพื่อใช้งานจริงบนแพลตฟอร์ม

เน็ตฟลิกซ์ให้ความสำคัญกับความเชื่อถือได้ (Reliability) ของโมเดล ขณะที่ Offline Model ต้อง Train อย่างเชื่อถือได้นั้น Online Model ก็ต้อง Perform อย่างเชื่อถือได้เช่นกัน การฝึกซ้ำ (Retraining) ของโมเดลต้องทำได้โดยอัตโนมัติและสามารถ Train ซ้ำได้เรื่อย ๆ

โมเดลในฝั่งออฟไลน์

แน่นอนว่าเวลาอาจทำให้ข้อมูลมีการเปลี่ยนแปลงโดยฉับพลัน หรืออาจมีปัญหาทางเทคนิคในขั้นตอนเก็บข้อมูล ซึ่งสองปัญหานี้จะส่งผลกับ Performance ของโมเดลเป็นแน่ ดังนั้นระบบในการตรวจจับปัญหาเป็นสิ่งที่จำเป็นเพื่อป้องกันไม่ให้โมเดลที่มี Performance ต่ำถูกเลือกมาใช้บนแพลตฟอร์ม หนึ่งในระบบนี้ของเน็ตฟลิกซ์ใช้ Anomaly Detection เพื่อตรวจจับความผิดปกติในชุดข้อมูลที่นำมาใช้พัฒนาโมเดล

Anomaly Detection ในการตรวจวัดตัวเลขของจำนวนข้อมูลที่ถูกใช้เพื่อ train โมเดล ส่วนที่วงสีแดงเป็นบริเวณที่ข้อมูลมีจำนวนลดลงอย่างประหลาด

จากภาพจะเห็นได้ชัดว่า จำนวนตัวอย่างที่ใช้ Train ตกลงจนผิดปกติในบริเวณที่วงสีแดงไว้ เมื่อเกิดเหตุเช่นนี้ระบบ Anomaly Detection ของเน็ตฟลิกซ์จะส่งสัญญาณเตือนและหยุดการเผยแพร่ (Publish) ไว้ก่อน นอกจากตัวอย่างนี้แล้วยังมีตัวอย่างอื่นอีกมากมายในส่วนของการ Training ในฝั่งออฟไลน์ เช่น การ Train โมเดลจากการสุ่มที่หลากหลาย เพื่อป้องกันการ Overfit

โมเดลในฝั่งออนไลน์

ในฝั่งของด้านออนไลน์นั้น การตรวจสอบความผิดพลาดเป็นส่วนสำคัญ เพราะมันคือสิ่งที่ลูกค้าจะเห็นแล้วเน็ตฟลิกซ์ได้ทำการเช็คค่าที่ควรจะคงที่ ยกตัวอย่างเช่น ค่าความน่าจะเป็น (Probability) ที่ไม่ควรมากกว่า 1 หรือในกรณีที่ Output ของโมเดลเป็น NaN หรือ infinity ซึ่งกรณีพวกนี้จะเกิดขึ้นได้โดยการมี Unexpected Change, Bad Assumption หรือ Engineering Issue ดังนั้นจึงควรต้องมีการตั้ง เงื่อนไขเพื่อป้องกันการนำโมเดลที่มีข้อบกพร่องไปใช้กับลูกค้า

หลังจากนั้นส่วนหลักจะเป็นการเก็บผลลัพธ์ดูว่าตัวโมเดลที่ทางเน็ตฟลิกซ์ได้ Deploy ไปนั้นดีแค่ไหนโดยการดูว่าสิ่งที่แนะนำไป สมาชิกถูกใจหรือเปล่า เมื่อเก็บผลมาได้แล้วก็จะมา Evaluate ตัวโมเดลกันซึ่งหากโมเดลปัจจุบันไม่สามารถทำงานได้ดี จะได้ดำเนินการแก้ไข เช่นการดึงโมเดลตัวเก่ามาใช้ไปพลาง แล้วค่อยมาหาสาเหตุว่าทำไมโมเดลถึงมี Performance ที่ต่ำลง อาจเป็นเพราะข้อมูลที่ใช้ Train มีการเปลี่ยนแปลง หรือข้อมูลที่ใช้ Train มีอายุที่เก่าเกินไปสำหรับพฤติกรรมการดูในปัจจุบัน จากตัวอย่างนี้จะเห็นได้ชัดว่าเน็ตฟลิกซ์ได้มีการวางแผนที่รอบคอบในการป้องกันความผิดพลาดเชิงเทคนิคต่าง ๆ ที่อาจเกิดขึ้นเมื่อไรก็ได้


การใช้ข้อมูลทำให้เน็ตฟลิกซ์ทราบว่าควรผลิต Content หรือออก Promotion อะไร

การใช้ข้อมูลให้เกิดผลประโยชน์มากที่สุด เป็นสิ่งที่เน็ตฟลิกซ์กำลังทำ และ ทำได้ดีอีกด้วย การใช้ข้อมูลของเน็ตฟลิกซ์ไม่ได้แค่สร้างความพึงพอใจให้กับสมาชิก แต่ยังสามารถทราบได้ว่าควรจะสร้างเนื้อหา (Content) หนังอะไร หรือออกโปรโมชันต่าง ๆ ที่เกี่ยวข้องกับแพลตฟอร์ม แน่นอนว่าตอนนี้หลาย ๆ บริษัท หลาย ๆ วงการเริ่มใช้ข้อมูลในการประกอบการตัดสินใจต่าง ๆ ถ้าเพื่อน ๆ ยังไม่สามารถใช้ข้อมูลให้เกิดประโยชน์มากที่สุดโดยเร็ว อาจเสียเปรียบให้กับคู่แข่งที่เล็งเห็นการใช้ข้อมูลให้เกิดประโยชน์ก็เป็นได้

แหล่งที่มา: https://www.slideshare.net/justinbasilico/making-netflix-machine-learning-algorithms-reliable




Senior Data Scientist
Big Data Institute (Public Organization), BDI

แบ่งปันบทความ

กลุ่มเนื้อหา

แท็กยอดนิยม

แจ้งเรื่องที่อยากอ่าน

คุณสามารถแจ้งเรื่องที่อยากอ่านให้เราทราบได้ !
และเราจะนำไปพัฒนาบทความให้มีเนื้อหาที่น่าสนใจมากขึ้น

ไอคอน PDPA

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ “นโยบายคุ้กกี้” และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ “ตั้งค่า”

ตั้งค่าความเป็นส่วนตัว

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

ยอมรับทั้งหมด
จัดการความเป็นส่วนตัว
  • คุกกี้ที่มีความจำเป็น (Strictly Necessary Cookies)
    เปิดใช้งานตลอด

    คุกกี้ประเภทนี้มีความจำเป็นต่อการให้บริการเว็บไซต์ของ สำนักงานคณะกรรมการคุ้มครองข้อมูลส่วนบุคคล เพื่อให้ท่านสามารถเข้าใช้งานในส่วนต่าง ๆ ของเว็บไซต์ได้ รวมถึงช่วยจดจำข้อมูลที่ท่านเคยให้ไว้ผ่านเว็บไซต์ การปิดการใช้งานคุกกี้ประเภทนี้จะส่งผลให้ท่านไม่สามารถใช้บริการในสาระสำคัญของ สำนักงานคณะกรรมการคุ้มครองข้อมูลส่วนบุคคล ซึ่งจำเป็นต้องเรียกใช้คุกกี้ได้
    รายละเอียดคุกกี้

  • คุกกี้เพื่อการวิเคราะห์และประเมินผลการใช้งาน (Performance Cookies)

    คุกกี้ประเภทนี้ช่วยให้ BDI ทราบถึงการปฏิสัมพันธ์ของผู้ใช้งานในการใช้บริการเว็บไซต์ของ BDI รวมถึงหน้าเพจหรือพื้นที่ใดของเว็บไซต์ที่ได้รับความนิยม ตลอดจนการวิเคราะห์ข้อมูลด้านอื่น ๆ BDI ยังใช้ข้อมูลนี้เพื่อการปรับปรุงการทำงานของเว็บไซต์ และเพื่อเข้าใจพฤติกรรมของผู้ใช้งานมากขึ้น ถึงแม้ว่า ข้อมูลที่คุกกี้นี้เก็บรวบรวมจะเป็นข้อมูลที่ไม่สามารถระบุตัวตนได้ และนำมาใช้วิเคราะห์ทางสถิติเท่านั้น การปิดการใช้งานคุกกี้ประเภทนี้จะส่งผลให้ BDI ไม่สามารถทราบปริมาณผู้เข้าเยี่ยมชมเว็บไซต์ และไม่สามารถประเมินคุณภาพการให้บริการได้

  • คุกกี้เพื่อการใช้งานเว็บไซต์ (Functional Cookies)

    คุกกี้ประเภทนี้จะช่วยให้เว็บไซต์ของ BDI จดจำตัวเลือกต่าง ๆ ที่ท่านได้ตั้งค่าไว้และช่วยให้เว็บไซต์ส่งมอบคุณสมบัติและเนื้อหาเพิ่มเติมให้ตรงกับการใช้งานของท่านได้ เช่น ช่วยจดจำชื่อบัญชีผู้ใช้งานของท่าน หรือจดจำการเปลี่ยนแปลงการตั้งค่าขนาดฟอนต์หรือการตั้งค่าต่าง ๆ ของหน้าเพจซึ่งท่านสามารถปรับแต่งได้ การปิดการใช้งานคุกกี้ประเภทนี้อาจส่งผลให้เว็บไซต์ไม่สามารถทำงานได้อย่างสมบูรณ์

  • คุกกี้เพื่อการโฆษณาไปยังกลุ่มเป้าหมาย (Targeting Cookies)

    คุกกี้ประเภทนี้เป็นคุกกี้ที่เกิดจากการเชื่อมโยงเว็บไซต์ของบุคคลที่สาม ซึ่งเก็บข้อมูลการเข้าใช้งานและเว็บไซต์ที่ท่านได้เข้าเยี่ยมชม เพื่อนำเสนอสินค้าหรือบริการบนเว็บไซต์อื่นที่ไม่ใช่เว็บไซต์ของ BDI ทั้งนี้ หากท่านปิดการใช้งานคุกกี้ประเภทนี้จะไม่ส่งผลต่อการใช้งานเว็บไซต์ของ BDI แต่จะส่งผลให้การนำเสนอสินค้าหรือบริการบนเว็บไซต์อื่น ๆ ไม่สอดคล้องกับความสนใจของท่าน

บันทึกการตั้งค่า
ไซต์นี้ลงทะเบียนกับ wpml.org ในฐานะไซต์พัฒนา สลับไปยังไซต์การผลิตโดยใช้รหัส remove this banner.