รายงานของกรมตำรวจ Tempe เกี่ยวกับการสืบสวนการชน ซึ่งได้รับจาก EE Timesให้รายละเอียดว่าเกิดอะไรขึ้น รายงานระบุว่า Uber Volvo (สีแดงในกราฟิกด้านล่าง) กำลังเคลื่อนที่ไปทางใต้ด้วยความเร็ว 38 ไมล์ต่อชั่วโมง (61 กม.) ในโซนความเร็ว 40 ไมล์ต่อชั่วโมง (64 กม.) เมื่อชนกับ Honda (สีน้ำเงินในกราฟิก) ซึ่งเลี้ยวไปทางตะวันตกเป็นถนนด้านข้าง (จุดที่ 1 ). ออกนอกเส้นทาง Uber Volvo ชนสัญญาณไฟจราจรตรงหัวมุม (จุดที่ 2) จากนั้นหมุนและพลิกกลับ สร้างความเสียหายให้กับรถคันอื่น
อีกสองคัน (จุดที่ 3 และ 4) ก่อนที่จะไถลไปหยุดด้านข้าง (จุดที่ 5)
แต่Mike Demlerนักวิเคราะห์จากที่ปรึกษาด้านเทคโนโลยี ของ Linley Group บอกกับ EE Timesว่ารถ Uber น่าจะทำได้ดีกว่านี้ มันเป็นเรื่องประมาทและงี่เง่าโดยสิ้นเชิงที่จะขับด้วยความเร็ว 38 ไมล์ต่อชั่วโมงผ่านสี่แยกที่มองไม่เห็น
Demler กล่าวว่า Uber จำเป็นต้องอธิบายว่าเหตุใดรถจึงแล่นผ่านสี่แยกด้วยความเร็วที่จำกัด เมื่อสามารถ “เห็น” ว่าการจราจรหยุดที่เลนกลางและเลนซ้ายสุด
รายงานของ EE Times กล่าวว่า Uber ได้ “เงียบ” ในเหตุการณ์นี้ แต่เนื่องจาก Uber ใช้ “การเรียนรู้เชิงลึก” เพื่อควบคุมรถยนต์ไร้คนขับ จึงไม่ชัดเจนว่า Uber สามารถตอบคำถามของ Demler ได้แม้ว่าจะต้องการก็ตาม
ในการเรียนรู้เชิงลึก รหัสจริงที่จะทำให้การตัดสินใจไม่ช้าลงจะเป็นสถานะที่ซับซ้อนในโครงข่ายประสาทเทียม ไม่ใช่บรรทัดของรหัสที่กำหนดกฎง่ายๆ เช่น “ถ้าการมองเห็นถูกกีดขวางที่ทางแยก ให้ช้าลง”
การดีบักการเรียนรู้เชิงลึก
กรณีนี้ก่อให้เกิดปัญหาทางเทคนิคเชิงลึก คุณจะแก้ไขข้อบกพร่องของระบบควบคุมยานพาหนะอัตโนมัติที่ใช้การเรียนรู้เชิงลึกได้อย่างไร คุณจะลดความเสี่ยงที่รถยนต์ไร้คนขับจะถูกชนและพลิกคว่ำได้อย่างไรเมื่อผู้คนที่ขับอยู่ข้างๆ ตัดสินในทางที่ผิด
ประเด็นของ Demler คือรถ Uber ไม่ได้ “เรียนรู้” ที่จะชะลอความเร็วตามมาตรการป้องกันล่วงหน้าอย่างรอบคอบที่ทางแยกที่มีสิ่งกีดขวาง โดยธรรมชาติแล้วผู้ขับขี่ส่วนใหญ่จะระวังและชะลอความเร็วเมื่อเข้าใกล้ทางแยกที่มีสิ่งกีดขวางเนื่องจากรถจอดนิ่ง เมื่อพูดถึงการเรียนรู้แบบเสริมแรงเชิงลึกสิ่งนี้อาศัย “ฟังก์ชันคุณค่า” เพื่อประเมินสถานะที่เป็นผลมาจากการใช้นโยบาย
ฟังก์ชันค่าคือตัวเลขที่ประเมินสถานะ ในหมากรุก การเปิดที่แข็งแกร่ง
ด้วยสีขาว เช่น การจำนำ e7 ถึง e5 จะดึงดูดมูลค่าสูง การเปิดที่อ่อนแอ เช่น การจำนำ a2 ถึง a3 จะดึงดูดการเปิดที่ต่ำ
ฟังก์ชันค่าอาจเป็นเหมือน “อุ๊ย” สำหรับคอมพิวเตอร์ การเรียนรู้การเสริมแรงได้ชื่อมาจากการเสริมแรงทางบวกและทางลบในด้านจิตวิทยา
จนกว่ารถ Uber จะชนอะไรบางอย่าง และฟังก์ชันคุณค่าของการเรียนรู้เชิงลึกจะบันทึกสิ่งที่เทียบเท่าทางดิจิทัลว่า “การปฏิบัติตามนโยบายนั้นนำไปสู่สถานะที่ไม่ดี – ด้านข้าง ถูกชน และเผชิญหน้าในทางที่ผิด – อุ๊ย!” ระบบควบคุม Uber อาจประเมินความเสี่ยงได้ไม่ดีพอ
หวังว่าจะได้เรียนรู้บทเรียนจากโรงเรียนแห่งการกระแทกอย่างหนัก ในอนาคต รถ Uber น่าจะทำได้ดีกว่านี้ในจุดตัดเดียวกันที่มีสภาพการจราจรใกล้เคียงกัน
การดีบักตรรกะที่เป็นทางการ
อีกทางเลือกหนึ่งสำหรับการเรียนรู้เชิงลึกคือยานพาหนะที่เป็นอิสระโดยใช้กฎที่ระบุไว้อย่างชัดเจนซึ่งแสดงออกด้วยตรรกะที่เป็นทางการ
สิ่งนี้ได้รับการพัฒนาโดยnuTonomyซึ่งดำเนินการนำร่องแท็กซี่อัตโนมัติโดยร่วมมือกับทางการในสิงคโปร์
กฎต่างๆ เช่น “รักษาความเร็วเมื่อปลอดภัย” และ “อย่าข้ามเส้นกึ่งกลาง” จะมีลำดับความสำคัญต่ำกว่า ในขณะที่กฎ เช่น “ให้นั่งสบาย” เป็นกฎข้อแรกที่จะหักเมื่อเกิดเหตุฉุกเฉิน
แม้ว่า NuTonomy ใช้แมชชีนเลิร์นนิงสำหรับหลายสิ่งหลายอย่าง แต่ไม่ได้ใช้เพื่อการควบคุมเชิงบรรทัดฐาน นั่นคือการตัดสินใจว่ารถยนต์ควรทำอะไร
ในเดือนตุลาคมปีที่แล้วอุบัติเหตุของรถทดสอบของ NuTonomy มีส่วนเกี่ยวข้องกับอุบัติเหตุ : ดอกต๊าปความเร็วต่ำทำให้เกิดรอยบุบ ไม่ใช่หมุนแล้วพลิก
Doug Parker ประธานเจ้าหน้าที่ฝ่ายปฏิบัติการของบริษัทบอกกับ IEEE Spectrumว่า:
สิ่งที่คุณต้องการคือสามารถย้อนกลับไปพูดว่า “รถของเราทำสิ่งที่ถูกต้องในสถานการณ์นั้นหรือไม่ และถ้าไม่ใช่ ทำไมมันถึงตัดสินใจไม่ถูก” ด้วยตรรกะที่เป็นทางการ มันง่ายมาก
ข้อได้เปรียบที่สำคัญของตรรกะที่เป็นทางการคือความถูกต้องที่พิสูจน์ได้และความง่ายในการแก้ไขจุดบกพร่อง การดีบักแมชชีนเลิร์นนิงนั้นยุ่งยากกว่า ในทางกลับกัน ด้วยการเรียนรู้ของเครื่อง คุณไม่จำเป็นต้องเขียนโค้ดลำดับชั้นของกฎที่ซับซ้อน
เวลาจะบอกได้ว่าแนวทางใดดีกว่าในการเรียนขับรถสำหรับรถยนต์ไร้คนขับ สำหรับตอนนี้ทั้งสองระบบยังมีอะไรให้เรียนรู้อีกมาก
Credit : สล็อตแตกง่าย