ข้อจำกัดของการทดสอบสำหรับ การเฝ้าระวังวิดีโอการจดจำใบหน้า

การเฝ้าระวังวิดีโอการจดจำใบหน้า ในแต่ละปี สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ (NIST) จะทำการทดสอบผู้จำหน่ายระบบจดจำใบหน้า (Face Recognition Vendor Test หรือที่เรียกว่า FRVT) ซึ่งออกแบบมาเพื่อประเมินอิสระของเทคโนโลยีการจดจำใบหน้าที่มีจำหน่ายในท้องตลาดและต้นแบบ

NIST ก่อตั้งขึ้นในปี พ.ศ. 2444 เป็นหน่วยงานรัฐบาลกลางที่ไม่อยู่ภายใต้การกำกับดูแลภายในกระทรวงพาณิชย์ของสหรัฐอเมริกา พันธกิจของ NIST คือการส่งเสริมนวัตกรรมและความสามารถในการแข่งขันทางอุตสาหกรรมของสหรัฐฯ โดยการพัฒนาวิทยาศาสตร์การวัด มาตรฐาน และเทคโนโลยี ซึ่งช่วยเพิ่มความมั่นคงทางเศรษฐกิจและปรับปรุงคุณภาพชีวิตของเรา

การทดสอบการจดจำใบหน้าทำอย่างไร?

FRVT วัดประสิทธิภาพของเทคโนโลยีการจดจำใบหน้าอัตโนมัติที่นำไปใช้กับงานพลเรือน การบังคับใช้กฎหมาย และความมั่นคงแห่งมาตุภูมิที่หลากหลาย รวมถึงการตรวจสอบภาพวีซ่า การกำจัดสำเนาหนังสือเดินทาง และการจดจำผ่านภาพข่าว ขณะนี้ FRVT มีอัลกอริธึมการจดจำใบหน้าประมาณ 200 รายการ และทดสอบกับชุดภาพถ่ายอย่างน้อย 6 คอลเลกชั่นที่มีผู้คนมากกว่า 8 ล้านคนหลายชุด อัลกอริธึมที่ดีที่สุดสำหรับการตรวจสอบแบบ 1:1 ให้อัตราการไม่ตรงกันที่ผิดพลาดที่ 0.0003 ที่อัตราที่ตรงกันที่เท็จที่ 0.0001 บนภาพวีซ่าคุณภาพสูง

5 ข้อจำกัดของ FRVT สำหรับกรณีการใช้งานกล้องวงจรปิด

ข่าวดีสำหรับ NIST คือเรามีหน่วยงานอิสระที่ทำการทดสอบซอฟต์แวร์ของบุคคลที่สาม – a la Consumer Reports หรือ JD Power – และจัดทำมาตรฐานประสิทธิภาพอุตสาหกรรม น่าเสียดายที่องค์กรหลายแห่งคิดว่าการทดสอบเหล่านี้ใช้ได้กับซอฟต์แวร์เฝ้าระวังวิดีโอด้วยเช่นกัน แต่จริงๆ แล้วไม่ใช่

อย่าพลาด FRVT ตอบสนองวัตถุประสงค์ของมัน การทดสอบมีความเกี่ยวข้องอย่างมากกับกรณีการใช้งานที่หลากหลาย ตั้งแต่การควบคุมการเข้าออกไปจนถึงการควบคุมชายแดน โดยที่ผู้ทดลองกำลังมองกล้องโดยตรง และภาพของบุคคลนั้นจะถูกเปรียบเทียบกับรายการเฝ้าดูที่รู้จักหรือรายชื่อพนักงานที่ได้รับอนุญาต ในกรณีการใช้งานเหล่านี้ รูปภาพของวัตถุและรูปภาพในรายการเฝ้าดูโดยทั่วไปจะมีคุณภาพสูง

อย่างไรก็ตาม ต่อไปนี้เป็นเหตุผล 5 ประการที่องค์กรไม่ ควร ใช้ FRVT ในการเปรียบเทียบโซลูชันกล้องวงจรปิดโดยใช้การจดจำใบหน้า

1. FRVT ไม่ประเมินโซลูชันการจดจำใบหน้าด้วยวิดีโอเฝ้าระวังแบบเรียลไทม์

การทดสอบ FRVT เริ่มต้นด้วยการป้อนข้อมูลเดียว – ภาพถ่ายคงที่ของใบหน้า ไม่ว่าจะเป็นภาพ Mugshot หรือวีซ่า (ภาพถ่ายจะถูกรวบรวมร่วมกับการยื่นคำร้องขอวีซ่า) – และภาพถ่าย “เถื่อน” (ภาพบุคคลที่ถ่าย ในการตั้งค่าทั่วไปในชีวิตประจำวัน)

ซอฟต์แวร์ เช่น โซลูชัน OnWatch ของ Oosto ทำงานร่วมกับวิดีโอสตรีมเพื่อระบุตัวบุคคล ซึ่งโดยปกติแล้วขณะที่พวกเขากำลังเข้าไปในโรงงาน เพื่อระบุว่าพวกเขาอยู่ในรายการเฝ้าดูหรือไม่ AI และโครงข่ายประสาทเทียมที่อยู่เบื้องหลังการจดจำใบหน้าผ่านวิดีโอนั้นแตกต่างโดยพื้นฐานจากอัลกอริธึมการจดจำภาพพื้นฐาน 1:1 และ 1:n ที่ NIST ใช้ การเฝ้าระวังวิดีโอการจดจำใบหน้า

2. FRVT ไม่ได้ระบุเงื่อนไขในโลกแห่งความเป็นจริงสำหรับการเฝ้าระวังด้วยวิดีโอ

อัลกอริธึมของ Oosto ได้รับการฝึกฝนจากฟุตเทจในโลกแห่งความเป็นจริง และทำงานได้ดีเป็นพิเศษในสภาวะที่ไม่เอื้ออำนวย เช่น แสงน้อย มุมที่ไม่ดี การบดบัง (เช่น หน้ากาก) ท่าทางที่รุนแรง และในชุดข้อมูลที่หลากหลายมาก ในทางตรงกันข้าม ผู้จำหน่ายหลายรายที่เข้าร่วมใน NIST อาจทำงานได้ดีในสภาพห้องปฏิบัติการที่มีการควบคุม แต่ไม่ได้ดำเนินการอย่างรวดเร็วหรือแม่นยำเท่ากับสถานการณ์ “ในป่า”

เมื่อฉันใช้คำว่า “ในป่า” คำนี้แตกต่างจากคำจำกัดความของ “ป่า” ของ NIST ซึ่งผู้คนไม่จำเป็นต้องโพสท่าหรือให้ความร่วมมือในการถ่ายภาพ ภาพธรรมชาติของ NIST อาจพร่ามัวหรือมีคุณภาพต่ำ แต่ภาพยังคงค่อนข้างชัดเจน โดยทั่วไปแล้วกล้องจะอยู่ในระดับใบหน้า และแสงอยู่ในเกณฑ์ดี ในโลกแห่งความเป็นจริง บางทีในคาสิโนหรือสเตเดี้ยม วัตถุจะให้ความร่วมมือน้อยกว่ามากและไม่ได้มองกล้องโดยตรง ในสถานการณ์จริงเหล่านี้ เรามักพบกับการโพสท่าที่รุนแรง (โดยพิจารณาจากตำแหน่งที่ตั้งกล้อง) คุณภาพของภาพไม่ดี แสงน้อย หรือสิ่งบดบัง เช่น หมวก หน้ากาก หรือสิ่งปกปิดอื่นๆ นี่เป็นการทดสอบจริงสำหรับซอฟต์แวร์จดจำใบหน้า

ในภาพด้านบน สังเกตความพร่ามัวของภาพวิดีโอและระดับการบดบังใบหน้าหลายๆ ใบ นี่เป็นปัญหาที่ยากกว่าการจับคู่ภาพนิ่งของบุคคลที่หันเข้าหากล้องโดยตรงในสภาพแวดล้อมที่มีแสงสว่างเพียงพอ

3. FRVT ไม่ประเมินเทคโนโลยีการจดจำใบหน้าที่ออกแบบมาเพื่อตรวจจับบุคคลในฝูงชน

พูดตามตรง การทดสอบ NIST FRVT ไม่เคยออกแบบมาเพื่อประเมินเทคโนโลยีในสภาพแวดล้อมที่แออัดซึ่งมีผู้คนจำนวนมากเข้ามาในอาคารในเวลาเดียวกัน FRVT ได้รับการออกแบบมาสำหรับกรณีการใช้งานการควบคุมชายแดนหรือการยืนยันตัวตน (บริการตนเอง) น่าเสียดายที่องค์กรจำนวนมากที่ประเมินโซลูชันการจดจำใบหน้าไม่เข้าใจหรือชื่นชมความแตกต่างเล็กน้อยนี้จนกว่าพวกเขาจะปรับใช้โซลูชันการจดจำใบหน้าและพบกับผลบวกปลอมและผลลบเท็จจำนวนมาก เนื่องจากซอฟต์แวร์และอัลกอริทึมพื้นฐานไม่ได้ออกแบบมาเพื่อระบุตัวบุคคลใน ฝูงชนซึ่งจะมีระดับการบดบังและความพร่ามัวที่สูงขึ้นตามธรรมชาติ

4. FRVT ไม่คำนึงถึงคุณภาพของกล้องวิดีโอ

การทดสอบ NIST FRVT ตั้งสมมติฐานบางประการเกี่ยวกับคุณภาพของกล้องที่ใช้ถ่ายภาพวัตถุ สิ่งนี้สมเหตุสมผลเมื่อคุณพิจารณากรณีการใช้งานการควบคุมชายแดนซึ่ง FRVT ได้รับการออกแบบมา แต่เมื่อคุณเปลี่ยนบริบทเป็นการแจ้งเตือนรายการเฝ้าดู – การระบุนักแสดงที่ไม่ดีหรือวีไอพี – แบบเรียลไทม์ คุณภาพของกล้องจะมีความสำคัญมาก ประสิทธิภาพของระบบจดจำใบหน้าขึ้นอยู่กับคุณภาพของภาพทดสอบและภาพอ้างอิงที่เข้าร่วมในกระบวนการเปรียบเทียบใบหน้า ด้วย AI และโมเดลการเรียนรู้เชิงลึก กล้องจดจำใบหน้าอัจฉริยะแสดงความแม่นยำและประสิทธิภาพที่ดีขึ้นอย่างมาก แม้จะมีความท้าทายในชีวิตประจำวัน เช่น ระยะทางไกล วิดีโอความละเอียดต่ำ หรือสถานการณ์ที่ใบหน้าไม่ได้หันเข้าหากล้อง องค์กรที่ใช้ความละเอียดสูง

5. FRVT ติดตั้งกล้องในระดับใบหน้า

อัลกอริธึมการจดจำใบหน้ามีแนวโน้มที่จะมีความแม่นยำที่ดีในงานตรวจสอบของ NIST เนื่องจากผู้ทดสอบมักจะรู้ว่ากำลังถูกสแกนและสามารถจัดตำแหน่งตัวเองเพื่อให้กล้องมองเห็นใบหน้าได้อย่างชัดเจน ในการตั้งค่าที่มีการควบคุมมากขึ้น (เช่น สถานการณ์การควบคุมเส้นขอบหรือการควบคุมการเข้าถึง) รูปภาพที่ใช้สำหรับการจดจำใบหน้ามักจะ “สว่างเพียงพอ” ซึ่งหมายความว่ามีการส่องสว่างเต็มที่ ไม่มีเงาหรือมีแสงสว่างมากเกินไป

แต่โดยทั่วไปแล้วจะไม่เป็นเช่นนั้นเมื่อพูดถึงการเฝ้าระวังด้วยวิดีโอในป่า เช่น กล้องวงจรปิดแบบเครือข่าย ลองนึกถึงสนามกีฬาที่พยายามระบุนักเลงที่รู้จักหรือคาสิโนที่พยายามระบุผู้เล่นที่ได้เปรียบ กล้องวงจรปิดมักจะติดตั้งสูงบนผนังหรือเพดาน เนื่องจากภาพที่มีใบหน้าลดระดับจาก “คุณภาพภาพศีรษะ” เป็น “แสงน้อยที่มีเม็ดเล็กๆ” อัลกอริทึมการจดจำใบหน้าและโครงข่ายประสาทเทียมจึงต้องทำงานหนักขึ้น

ดังที่ NIST ตั้งข้อสังเกตว่า: “ภาพถ่ายที่มีคุณภาพต่ำจะบั่นทอนการจดจำ อาจเป็นเพราะระบบภาพไม่ดีหรือเพราะตัวแบบนำเสนอผิดที่กล้อง” (การวางแนวศีรษะ การแสดงสีหน้า การบดเคี้ยว ฯลฯ)

นี่ไม่ใช่คำฟ้อง

โพสต์นี้ไม่ได้มีวัตถุประสงค์เพื่อวิจารณ์ NIST สร้างขึ้นเพื่อช่วยให้ผู้ซื้อระดับองค์กรเข้าใจวัตถุประสงค์และข้อจำกัดของการทดสอบและการรายงาน FRVT ของ NIST ได้ดียิ่งขึ้น หากองค์กรของคุณกำลังประเมินโซลูชันที่มีการนำเสนอภาพถ่ายนิ่งของบุคคล และคุณจำเป็นต้องเปรียบเทียบภาพนั้นกับฐานข้อมูลภาพถ่าย ดังนั้น FRVT จึงเป็นวิธีที่ดีในการเปรียบเทียบผู้ให้บริการรายหนึ่งกับผู้ให้บริการรายอื่น (โดยมีข้อแม้บางประการที่เข้าใจได้)

แต่สำหรับกรณีการใช้งานกล้องวงจรปิดส่วนใหญ่ที่มีการใช้การวิเคราะห์วิดีโอสำหรับการตรวจจับการจดจำใบหน้าแบบเรียลไทม์ FRVT นั้นไม่เพียงพอและไม่เหมาะสมอย่างยิ่งในการเป็นเกณฑ์มาตรฐาน

เราสนับสนุนให้ NIST สร้างวิธีการทดสอบใหม่เพื่อเปรียบเทียบโซลูชันวิดีโอวงจรปิดที่มีการจดจำใบหน้าได้ดีขึ้น ซึ่งปัจจัยจากสภาวะในโลกแห่งความเป็นจริง เช่น แสงน้อย การบดบังมุมกล้องที่ท้าทาย และแม้แต่คุณภาพของกล้อง เห็นได้ชัดว่าสิ่งนี้จะช่วยให้ผู้ซื้อเชิงพาณิชย์เข้าใจถึงประสิทธิภาพที่แท้จริงของโซลูชันกล้องวงจรปิดเหล่านี้ แทนที่จะพึ่งพาการทดสอบ FRVT ที่ไม่ได้ลอกเลียนแบบโลกแห่งความเป็นจริง

Face-sso (By K&O) หากท่านสนใจ เครื่องสแกนใบหน้ารุ่นต่างๆ หลากหลายรุ่น หรือ ติดตั้งระบบสแกนใบหน้า สามารถติดต่อสอบถามได้โดยตรง เรามีแอดมินคอยคอบคำถาม 24 ชั้วโมงที่ Line OA เครื่องสแกนใบหน้า สามารถ ขอราคาพิเศษได้ ตามงบประมาณที่เหมาะสม สอบถามได้สบายใจทั้ง เรื่องค่าบริการ ราคา และ งบประมาณ มั่นใจเพราะเป็นราคาที่สุด คุ้มค่าที่สุด

หากท่านมีความสนใจ บทความ หรือ Technology สามารถติดต่อได้ตามเบอร์ที่ให้ไว้ด้านล่างนี้
Tel.086-594-5494
Tel.095-919-6699

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *