อัลกอริทึมแมชชีนเลิร์นนิง คิดได้อย่างไรว่าคุณควรดูอะไรต่อไป

อัลกอริทึมแมชชีนเลิร์นนิง คุณนั่งลงหน้าโทรทัศน์หรือพลิกไปที่แอพสตรีมมิ่งบนสมาร์ทโฟน คุณเลือกดูอะไร? การพิจารณาว่ารายการและภาพยนตร์ ใดจบลงต่อหน้าผู้ชมนั้นเป็นกระบวนการที่มนุษย์เป็นผู้ควบคุม แต่ละคนจะเห็นว่ามีเนื้อหาใดบ้าง พิจารณาว่ากลุ่มประชากรใดรับชมเมื่อใด และจัดตารางการแสดงและภาพยนตร์ในช่วงเวลาที่น่าจะมีผู้ชมที่เหมาะสม 

อย่างไรก็ตามด้วยบริการสตรีมมิ่งไม่มีกำหนดการ ทุกอย่างสามารถใช้ได้ทุกเวลา การแสดงที่ถูกต้องต่อหน้าผู้ชมเมื่อพวกเขาพร้อมที่จะรับชมกลายเป็นปัญหาหลัก 

สิ่งที่ครั้งหนึ่งเคยเป็นกระบวนการของมนุษย์ล้วน ๆ ได้พัฒนาขึ้นด้วยความก้าวหน้าของเทคโนโลยีแมชชีนเลิร์นนิง ที่ Warner Bros. Discovery เราใช้แมชชีนเลิร์นนิงเพื่อแสดงภาพยนตร์และรายการทีวีที่จะโดนใจผู้ชมมากที่สุด ทีมบรรณาธิการของเราได้เลือกโปรแกรมที่พวกเขาคิดว่าเป็นโปรแกรมที่ดีที่สุดในห้องสมุดของเรามานานแล้ว แต่โปรแกรมโปรดของคนๆ หนึ่งมักไม่ถูกใจใครอีกคนหนึ่งเสมอไป เช่นเดียวกับหลายๆ อุตสาหกรรม เราได้หันไปใช้แมชชีนเลิร์นนิงและข้อมูลผู้ใช้เพื่อทำให้ประสบการณ์ดิจิทัลของเราดีขึ้น 

เป้าหมายของเราคือการทำให้ประสบการณ์ของผู้ชมง่ายขึ้นและง่ายขึ้น เพื่อให้พวกเขาพบเนื้อหาที่ต้องการรับชมได้อย่างรวดเร็ว ไม่มีใครในอุตสาหกรรมที่ไขปัญหานี้ได้อย่างสมบูรณ์ ซึ่งเป็นสิ่งที่ทำให้น่าตื่นเต้นมาก 

ในบทความนี้ เราจะพูดถึงสิ่งที่เรากำลังทำกับ ML เพื่อให้แน่ใจว่ารายการโปรดใหม่ของคุณกำลังรอคุณอยู่เมื่อคุณเปิดDiscovery +หรือHBO Max

การย้ายจากกระบวนการของมนุษย์ไปสู่กระบวนการของเครื่องจักร

อย่างง่ายที่สุด คำแนะนำจะขึ้นอยู่กับรูปแบบ ถ้าคุณชอบนิยายวิทยาศาสตร์ คุณน่าจะดูหนังนิยายวิทยาศาสตร์มากกว่า จากการศึกษาของเรา เราพบว่าผู้ชมโดยเฉลี่ยมีแนวเพลงประมาณ 5 หรือ 6 ประเภท พวกมันไม่ใช่ประเภทเดียวกันสำหรับผู้ดูทุกคน ดังนั้นการเรียงลำดับการนำทางทั่วไป—แม้แต่การเรียงตามตัวอักษร—อาจเป็นเรื่องยาก คุณสามารถแสดงโปรแกรมยอดนิยมได้ แต่จากนั้นคุณก็จะละเลยเนื้อหา  หางยาว ของคุณ

ระบบอัตโนมัติที่ง่ายที่สุดที่เราทำได้คือทำให้มั่นใจว่าแนวเพลงโปรดของผู้ใช้นั้นเข้าถึงได้ง่ายที่สุด เราทำสิ่งนี้ทั้งในหน้าเรียกดู เมื่อผู้ใช้คลิกเข้าไปในรายการทีวีและภาพยนตร์ และเห็นประเภทที่มีให้ แต่ยังรวมถึงในหน้าแรกของผู้ใช้ด้วย การสร้างโฮมเพจนั้นจำเป็นต้องปรับเปลี่ยนในแบบของคุณ เพื่อที่ผู้ใช้จะไม่เลื่อนแล้วเลื่อนอีกเพื่อไปยังประเภทของรายการที่พวกเขาดูตลอดเวลา 

บรรณาธิการที่เป็นมนุษย์จะวิเคราะห์ประเภทเหล่านั้นและเลือกภาพยนตร์หรือรายการที่พวกเขาคิดว่าดีที่สุด: อัญมณี แต่บรรณาธิการคนเดียว ไม่ว่าจะมีรสนิยมดีแค่ไหน ก็ไม่สามารถเลือกผู้ชนะสำหรับทุกคนได้ เราเก็บข้อมูลประวัติของผู้ใช้ การโต้ตอบที่พวกเขาทำบนไซต์ และสัญญาณอื่น ๆ ที่บอกเราว่าพวกเขาสนใจอะไร เราใช้อัลกอริทึมการเรียนรู้เชิงลึกที่เรียกใช้ประวัติเหล่านี้ผ่านแบบจำลองตามลำดับเพื่อกำหนดความน่าจะเป็นของผู้ชมนี้ ต้องการชมการแสดงใด ๆ จากนั้นเราจะจัดอันดับเนื้อหาตามแนวโน้มที่จะดึงดูดลูกค้าและส่งอันดับนั้นไปให้พวกเขา ซึ่งนั่นคือสิ่งที่อัญมณีของพวกเขามี โดยพิจารณาจากข้อมูลที่พวกเขาส่งมาให้เรา 

แน่นอน เราไม่เพียงแค่ต้องการให้บริการเนื้อหาที่คุณชอบอยู่แล้วเท่านั้น บรรณาธิการที่เป็นมนุษย์นั้นเก่งมากในการหากลุ่มความเชื่อมโยงที่กว้างขึ้นระหว่างสื่อต่างๆ พวกเขาจะแนะนำบางสิ่งที่ไม่ใช่เพราะข้อมูลเมตาบอกว่ามีฉากแอ็คชั่นที่นี่และฉากโรแมนติกที่นี่ แต่เป็นเพราะตัวแก้ไขกำลังเชื่อมต่อจุดที่อาจไม่สามารถแปลเป็นป้ายกำกับได้ง่ายๆ คุณชอบภาพยนตร์จากผู้กำกับคนนี้ บางทีคุณอาจจะชอบงานของพวกเขาในประเภทที่คุณไม่เคยสำรวจมาก่อน Pandora ลองใช้โมเดลนี้กับเพลงโดยให้บรรณาธิการที่เป็นมนุษย์สร้างความเชื่อมโยงระหว่างเพลง  อย่างชัดเจน อัลกอริทึมแมชชีนเลิร์นนิง

เครือข่ายการเชื่อมต่อที่สร้างเนื้อหาที่หลากหลายและประสบการณ์ที่น่ายินดีคือสิ่งที่เรากำลังสำรวจอยู่ในขณะนี้ เว้นแต่ว่าเรากำลังพยายามใช้โปรแกรม ML ของเราเพื่ออนุมานการเชื่อมต่อเหล่านั้น ไม่ว่าจะเป็นการเชื่อมต่อรูปแบบการดู การดูข้อมูลเมตา หรือการแยกตัวชี้นำจากตัวเนื้อหา เราต้องการสร้างกลุ่มเนื้อหาที่สมบูรณ์ยิ่งขึ้นมากกว่าที่จะหาได้จากสัญญาณประเภทเท่านั้น อัลกอริทึมแมชชีนเลิร์นนิง

Warner Brothers Discovery กำลังเปลี่ยนโดยรวมจากการเป็นกองบรรณาธิการที่หนักหน่วงและขับเคลื่อนโดยมนุษย์ไปสู่ ​​ML ที่หนักหน่วงมากขึ้น หนึ่งในสถานที่ที่เราเพิ่งเริ่มเข้าสู่วัฒนธรรมบรรณาธิการคือในสิ่งที่เราเรียกว่าแผงฮีโร่ ซึ่งเป็นแผงขนาดใหญ่ที่ด้านบนที่แสดงตัวอย่างรายการเดียวสำหรับรายการเด่น บรรณาธิการของเรามักจะเลือกสิ่งที่จะไปที่นั่น—ไม่ใช้เครื่องจักร เป็นเพียงชุดตัวเลือกที่หมุนเวียนตลอดเวลา ตอนนี้ เรากำลังเปลี่ยนสิ่งนี้ให้กลายเป็นปัญหาการเรียนรู้ของเครื่อง โดยพยายามหาวิธีปรับแต่งพื้นที่นั้นให้เป็นส่วนตัวด้วยชุดโปรแกรมที่เกี่ยวข้องกับผู้ที่กำลังดูพื้นที่นั้นหมุนเวียนอยู่ตลอดเวลา 

เครื่องที่แนะนำภาพยนตร์ให้คุณ

มีตัวเลือกและเครื่องมือมากมายในการสร้างโซลูชัน ML ในปัจจุบัน เราเป็นร้านค้า AWS ส่วนใหญ่ และเราเริ่มต้นเส้นทาง ML โดยใช้บริการจำนวนมากของพวกเขา รวมถึง SageMaker สำหรับการฝึกอบรมโมเดลและไปป์ไลน์การปรับใช้ เราใช้ AWS Personalize สำหรับเครื่องมือแนะนำเบื้องต้นของเรา มันช่วยให้เราเริ่มต้นได้อย่างรวดเร็วและทำงานได้ดีกับปัญหาส่วนใหญ่ 

ตอนนี้เรากำลังสร้างโมเดลของเราเองใน TensorFlow หากคุณต้องการกรอบการประเมินที่สมบูรณ์ยิ่งขึ้น เวลาตอบสนองที่เร็วขึ้น และการควบคุมเทคนิคการเรียนรู้และอัลกอริทึมที่ใช้มากขึ้น นั่นคือขั้นตอนต่อไป โมเดลแบบกำหนดเองของเราทำงานได้ดีพอๆ กับสิ่งที่อุตสาหกรรมและ AWS จัดหาให้ และเรากำลังต้องการสร้างไปป์ไลน์ ML ที่รองรับกรณีการใช้งานเฉพาะของเราโดยไม่ต้องอาศัยเฟรมเวิร์กทั่วไปเหล่านี้ 

เราไม่ได้ต้องการคิดค้นล้อขึ้นมาใหม่ มีเทคโนโลยีโอเพ่นซอร์สและโซลูชันสำหรับองค์กรจำนวนมากที่เรากำลังพิจารณาที่จะเพิ่มเข้าไปในสแต็กของเรา เรากำลังดูเทคโนโลยีอย่างเช่นFeastสำหรับฟีเจอร์สโตร์และเครื่องมืออนุมานอย่าง KServe และ MLflow เพื่อจัดการการทดลองและไปป์ไลน์การปรับใช้ของเรา ด้วยเครื่องมือที่เรากำหนดเองและเทคโนโลยีโอเพ่นซอร์สที่ยอดเยี่ยมในตลาด เราสามารถออกแบบโซลูชัน ML ที่จัดการกับกรณีการใช้งานเฉพาะของเราได้ 

ในความเป็นจริงแล้ว ML tooling โดยทั่วไปมีมาไกลมาก แถบสำหรับการเริ่มต้นได้ลดลงอย่างมากในช่วงทศวรรษที่ผ่านมา ซึ่งคุณสามารถสร้างไปป์ไลน์ ML ที่มีประสิทธิภาพมากได้เพียงแค่ใช้เครื่องมือนอกกรอบ ด้วยความก้าวหน้าของฮาร์ดแวร์และอัลกอริทึมที่คุณสามารถใช้ประโยชน์ได้ คุณสามารถบูตสแตรปโซลูชันที่มีประสิทธิภาพมากซึ่งจะทำการอนุมานในเสี้ยวมิลลิวินาที 

หากคุณต้องการพัฒนาเฟรมเวิร์กการประเมินที่สมบูรณ์ยิ่งขึ้นและเจาะลึกลงไปในชุดข้อมูลการฝึกอบรมของคุณ ถึงเวลานั้นคุณสามารถเริ่มปรับแต่ง เราได้พัฒนาโมเดลและไปป์ไลน์ของเราเองเพื่อให้เราควบคุมเทคนิคการเรียนรู้ได้มากขึ้น และช่วยให้ชุดข้อมูลของเรามีเวลาตอบสนองเร็วขึ้น จากนั้นเราสามารถสร้างโซลูชันที่เราได้บูทสแตรปไว้

แน่นอนว่าเครื่องมือ อัลกอริทึม และโมเดลไม่ใช่ส่วนที่ยากที่สุดเกี่ยวกับแมชชีนเลิร์นนิง มันคือข้อมูล 

ปัญหาที่แท้จริงคือข้อมูล

รหัส ML เป็นส่วนเล็ก ๆ ของปริศนาที่ใหญ่กว่า: ข้อมูล การรวมข้อมูลและข้อมูลเมตาจำนวนมหาศาลเข้าด้วยกันเพื่อกำหนดคุณสมบัติและตัดสินใจว่าจะใช้ความหมายอย่างไรนั้นทั้งยากและจำเป็น หากคุณเคยผ่านบทช่วยสอน ML ข้อมูลจะมอบให้คุณ แต่ในการใช้งานจริง ข้อมูลจะไม่มีคุณภาพสูงเท่าที่คุณต้องการ คุณลงเอยด้วยการต่อสู้กับข้อมูลสำหรับโมเดลของคุณแล้วฝึกฝนโมเดลของคุณ แต่ส่วนการจัดการข้อมูลเป็นส่วนที่เราใช้เวลาส่วนใหญ่ 

เครื่องมือโอเพ่นซอร์สบางตัวนั้นดีมากจนคุณสามารถเขียนโค้ดสองบรรทัดใน Tensorflow และมีแอปพลิเคชัน ML เป็นของตัวเอง แต่จากนั้นคุณต้องปรับใช้ และเมื่อคุณปรับใช้ในสถานการณ์ธุรกิจจริง คุณจะต้องดำเนินการผ่านรายการตรวจสอบต่างๆ ไปป์ไลน์ต้องทำงานแบบเรียลไทม์ ปรับขนาดได้อย่างรวดเร็ว บำรุงรักษาได้ และยังคงโปร่งใสเพียงพอสำหรับเราที่จะประเมินว่าเรากำลังปฏิบัติตามสัญญาณที่ถูกต้องและสนับสนุนผู้ใช้ในทิศทางที่ดีหรือไม่ 

รับสัญญาณง่ายๆ: เวลาในการรับชม หากผู้ดูดูรายการใดรายการหนึ่งมากกว่า พวกเขาอาจจะชอบ และเราสามารถใช้รายการนั้นเพื่อสรุปรายการอื่นๆ ที่พวกเขาอาจชอบได้ ค่อนข้างตรงไปตรงมา แต่ข้อมูลนั้นจำเป็นต้องไหลกลับจากผู้ดูไปยังระบบของเรา สตรีมเนื้อหาไปยังไคลเอ็นต์ ซึ่งมักจะบัฟเฟอร์เกินความจำเป็นเพื่อป้องกันการหยุดชะงัก เพื่อให้คำแนะนำของเราแสดงเนื้อหาที่ถูกต้อง ข้อมูลนี้จำเป็นต้องไหลย้อนกลับในเวลาเกือบเรียลไทม์ หากผู้ชมเกลียดการแสดงและคลิกกลับไปที่หน้าแรก หน้านั้นจะต้องพร้อมที่จะรีเฟรชด้วยคำแนะนำใหม่ 

ข้อมูลเหล่านี้จะกลายเป็นข้อมูลขนาดเพตะไบต์ในแต่ละวัน และข้อมูลนี้จำเป็นต้องรวบรวมและส่งผ่านไปยังระบบแบ็กเอนด์ของเรา ข้อมูลที่มาจากไคลเอ็นต์ไม่ได้อยู่ในรูปแบบที่ใช้งานได้ง่าย ดังนั้นการรวมข้อมูลให้เป็นรูปแบบที่สามารถรวบรวมและป้อนเข้าสู่โมเดลของเราจึงเป็นหนึ่งในงานที่ท้าทายที่สุดที่เราเผชิญ 

แต่เปอร์เซ็นต์การดูเป็นเมตริกพื้นฐานที่ค่อนข้างดี และไม่ได้บอกอะไรเรามากนักเกี่ยวกับสิ่งที่ผู้ชมชอบเกี่ยวกับรายการ เมตริกสำคัญอย่างหนึ่งของเราคือผลตอบแทนจากการลงทุนด้านเนื้อหา: จำนวนผู้ชมที่โปรแกรมได้รับขึ้นอยู่กับการลงทุนของเราในนั้น ส่วนหนึ่งของสิ่งที่เราต้องการจากสัญญาณที่ผู้ชมส่งกลับมาคือความสามารถในการเข้าใจเนื้อหาของวิดีโอได้ดีขึ้นโดยไม่ต้องพึ่งพาผู้ดูแลที่เป็นมนุษย์ เราเพียงแค่ขูดพื้นผิวของการแยกข้อมูลเมตาและคุณลักษณะต่างๆ จากวิดีโอ และกำลังพยายามตรวจสอบอย่างจริงจังว่ามีอะไรเพิ่มเติมที่เราสามารถเรียนรู้เกี่ยวกับเนื้อหาของเราจาก ML ได้หรือไม่ 

แมชชีนเลิร์นนิงเปลี่ยนแปลงอยู่เสมอ เช่นเดียวกับอัลกอริทึมของเรา ดังนั้นในขณะที่เราอัปเดตโมเดลและทำซ้ำตามข้อมูลของเรา เราต้องการวิธีที่ดีในการประเมินว่าโมเดลและการเปลี่ยนแปลงของคุณให้ผลลัพธ์ที่คุณต้องการหรือไม่ เราทำการทดลองมากมาย: การประเมินโมเดลแบบเทียบเคียงกับเมตริกเป้าหมายต่างๆ ขณะที่ผู้ใช้โต้ตอบกับรายการ ประเภท หรือส่วนต่างๆ ของแอป เราต้องการให้ฟีดข้อมูลนั้นกลับเข้าสู่โมเดลของเรา 

ความเสี่ยงคือเราให้น้ำหนักมากเกินไปกับเมตริกใดเมตริกหนึ่งหรืออีกเมตริกหนึ่ง หากเมตริกเดียวของเราคือเวลาในการดู อัลกอริทึมจะเพิ่มประสิทธิภาพสำหรับสิ่งนั้น และตัวเลขเหล่านั้นก็จะเพิ่มขึ้น แต่ผู้ชมเลือกเนื้อหาที่มีความหมายสำหรับพวกเขาหรือไม่ เรากำลังนำพวกเขาไปยังวิดีโอที่พวกเขาชอบหรือเราแค่โยนเนื้อหาจำนวนมากใส่พวกเขาจนมีบางอย่างติดขัด? การพึ่งพาเมตริกเดียวมากเกินไปอาจทำให้คุณละเลยความสมบูรณ์ของมาโครโดยรวม ซึ่งอาจส่งผลต่อลำดับที่สองโดยไม่ได้ตั้งใจสำหรับเนื้อหาที่เหลือของคุณ  

Face-sso (By K&O) หากท่านสนใจ เครื่องสแกนใบหน้ารุ่นต่างๆ หลากหลายรุ่น หรือ ติดตั้งระบบสแกนใบหน้า สามารถติดต่อสอบถามได้โดยตรง เรามีแอดมินคอยคอบคำถาม 24 ชั้วโมงที่ Line OA เครื่องสแกนใบหน้า สามารถ ขอราคาพิเศษได้ ตามงบประมาณที่เหมาะสม สอบถามได้สบายใจทั้ง เรื่องค่าบริการ ราคา และ งบประมาณ มั่นใจเพราะเป็นราคาที่สุด คุ้มค่าที่สุด

หากท่านมีความสนใจ บทความ หรือ Technology สามารถติดต่อได้ตามเบอร์ที่ให้ไว้ด้านล่างนี้
Tel.086-594-5494
Tel.095-919-6699

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *