เหตุใดบางครั้งแบบจำลองของ CNN จึงทำนายเพียงชั้นเดียวจากคนอื่น ๆ ทั้งหมด
ฉันค่อนข้างใหม่สำหรับแนวการเรียนรู้เชิงลึกดังนั้นโปรดอย่าหมายถึง Reddit! ดูเหมือนเป็นคำถามทั่วไปดังนั้นฉันจะไม่ให้รหัสของฉันที่นี่เพราะดูเหมือนว่าไม่จำเป็น (ถ้าเป็นเช่นนั้นนี่คือลิงค์ไปยังcolab )
บิตเกี่ยวกับข้อมูล: คุณสามารถค้นหาข้อมูลเดิมที่นี่ เป็นชุดข้อมูลดั้งเดิมที่ลดขนาดลงเป็น 82 GB
เมื่อฉันฝึก CNN เกี่ยวกับเรื่องนี้มันจะทำนายว่า 'No Diabetic Retinopathy' (No DR) ทุกครั้งทำให้มีความแม่นยำถึง 73% เหตุผลนี้เป็นเพียงภาพ No DR หรืออย่างอื่นจำนวนมหาศาลหรือไม่? ฉันไม่รู้! 5 ["Mild", "Moderate", "No DR", "Proliferative DR", "Severe"]
เรียนฉันมีการทำนายเป็น
อาจเป็นเพียงรหัสที่ไม่ดีหวังว่าพวกคุณจะช่วยได้
คำตอบ
ฉันกำลังจะแสดงความคิดเห็น:
แนวทางที่เข้มงวดยิ่งขึ้นคือการเริ่มวัดความสมดุลของชุดข้อมูลของคุณ: คุณมีรูปภาพของแต่ละคลาสกี่ภาพ สิ่งนี้น่าจะเป็นคำตอบสำหรับคำถามของคุณ
แต่อดไม่ได้ที่จะดูลิงค์ที่คุณให้มา Kaggle ให้ภาพรวมของชุดข้อมูลแล้ว:
การคำนวณอย่างรวดเร็ว: 25,812 / 35,126 * 100 = 73%
. 74%
นั่นเป็นที่น่าสนใจที่คุณบอกว่าคุณมีความถูกต้องของ แบบจำลองของคุณกำลังเรียนรู้เกี่ยวกับชุดข้อมูลที่ไม่สมดุลโดยมีการแสดงชั้นหนึ่ง25k/35k
มากเกินไป 74%
สมมติฐานของฉันอยู่ที่รูปแบบของคุณช่วยให้ทำนายชั้นแรกซึ่งหมายความว่าโดยเฉลี่ยคุณจะจบลงด้วยความถูกต้องของ
สิ่งที่คุณควรทำคือปรับสมดุลชุดข้อมูลของคุณ ตัวอย่างเช่นโดยอนุญาตให้เฉพาะ35,126 - 25,810 = 9,316
ตัวอย่างจากชั้นหนึ่งปรากฏในช่วงยุคหนึ่ง ยิ่งไปกว่านั้นให้ปรับสมดุลชุดข้อมูลของคุณในทุกชั้นเรียนเพื่อให้แต่ละชั้นเรียนปรากฏขึ้นครั้งละnครั้งต่อยุค
ดังที่อีวานสังเกตเห็นแล้วว่าคุณมีปัญหาเรื่องความไม่สมดุลของชั้นเรียน สามารถแก้ไขได้ผ่าน:
การทำเหมืองแร่ในเชิงลบอย่างหนักออนไลน์:ในแต่ละซ้ำหลังจากการคำนวณการสูญเสียคุณสามารถจัดเรียงองค์ประกอบทั้งหมดในชุดที่เป็น "ไม่ DR"
k
ชั้นและเก็บเฉพาะที่เลวร้ายที่สุด จากนั้นคุณประมาณการไล่ระดับสีโดยใช้ k ที่แย่กว่านี้เท่านั้นและทิ้งส่วนที่เหลือทั้งหมด
ดูตัวอย่างเช่น
Abhinav Shrivastava, Abhinav Gupta และ Ross Girshick Training Region-based Object Detectors with Online Hard Example Mining (CVPR 2016)การสูญเสียโฟกัส:การปรับเปลี่ยนสำหรับการสูญเสียเอนโทรปีข้าม "วานิลลา" สามารถใช้เพื่อจัดการกับความไม่สมดุลของคลาสได้
โพสต์ที่เกี่ยวข้องนี้และนี้