เหตุใดบางครั้งแบบจำลองของ CNN จึงทำนายเพียงชั้นเดียวจากคนอื่น ๆ ทั้งหมด

Jan 18 2021

ฉันค่อนข้างใหม่สำหรับแนวการเรียนรู้เชิงลึกดังนั้นโปรดอย่าหมายถึง Reddit! ดูเหมือนเป็นคำถามทั่วไปดังนั้นฉันจะไม่ให้รหัสของฉันที่นี่เพราะดูเหมือนว่าไม่จำเป็น (ถ้าเป็นเช่นนั้นนี่คือลิงค์ไปยังcolab )

บิตเกี่ยวกับข้อมูล: คุณสามารถค้นหาข้อมูลเดิมที่นี่ เป็นชุดข้อมูลดั้งเดิมที่ลดขนาดลงเป็น 82 GB

เมื่อฉันฝึก CNN เกี่ยวกับเรื่องนี้มันจะทำนายว่า 'No Diabetic Retinopathy' (No DR) ทุกครั้งทำให้มีความแม่นยำถึง 73% เหตุผลนี้เป็นเพียงภาพ No DR หรืออย่างอื่นจำนวนมหาศาลหรือไม่? ฉันไม่รู้! 5 ["Mild", "Moderate", "No DR", "Proliferative DR", "Severe"]เรียนฉันมีการทำนายเป็น

อาจเป็นเพียงรหัสที่ไม่ดีหวังว่าพวกคุณจะช่วยได้

คำตอบ

1 Ivan Jan 18 2021 at 00:21

ฉันกำลังจะแสดงความคิดเห็น:

แนวทางที่เข้มงวดยิ่งขึ้นคือการเริ่มวัดความสมดุลของชุดข้อมูลของคุณ: คุณมีรูปภาพของแต่ละคลาสกี่ภาพ สิ่งนี้น่าจะเป็นคำตอบสำหรับคำถามของคุณ

แต่อดไม่ได้ที่จะดูลิงค์ที่คุณให้มา Kaggle ให้ภาพรวมของชุดข้อมูลแล้ว:

การคำนวณอย่างรวดเร็ว: 25,812 / 35,126 * 100 = 73%. 74%นั่นเป็นที่น่าสนใจที่คุณบอกว่าคุณมีความถูกต้องของ แบบจำลองของคุณกำลังเรียนรู้เกี่ยวกับชุดข้อมูลที่ไม่สมดุลโดยมีการแสดงชั้นหนึ่ง25k/35kมากเกินไป 74%สมมติฐานของฉันอยู่ที่รูปแบบของคุณช่วยให้ทำนายชั้นแรกซึ่งหมายความว่าโดยเฉลี่ยคุณจะจบลงด้วยความถูกต้องของ

สิ่งที่คุณควรทำคือปรับสมดุลชุดข้อมูลของคุณ ตัวอย่างเช่นโดยอนุญาตให้เฉพาะ35,126 - 25,810 = 9,316ตัวอย่างจากชั้นหนึ่งปรากฏในช่วงยุคหนึ่ง ยิ่งไปกว่านั้นให้ปรับสมดุลชุดข้อมูลของคุณในทุกชั้นเรียนเพื่อให้แต่ละชั้นเรียนปรากฏขึ้นครั้งละnครั้งต่อยุค

2 Shai Jan 18 2021 at 04:30

ดังที่อีวานสังเกตเห็นแล้วว่าคุณมีปัญหาเรื่องความไม่สมดุลของชั้นเรียน สามารถแก้ไขได้ผ่าน:

  1. การทำเหมืองแร่ในเชิงลบอย่างหนักออนไลน์:ในแต่ละซ้ำหลังจากการคำนวณการสูญเสียคุณสามารถจัดเรียงองค์ประกอบทั้งหมดในชุดที่เป็น "ไม่ DR" kชั้นและเก็บเฉพาะที่เลวร้ายที่สุด จากนั้นคุณประมาณการไล่ระดับสีโดยใช้ k ที่แย่กว่านี้เท่านั้นและทิ้งส่วนที่เหลือทั้งหมด
    ดูตัวอย่างเช่น
    Abhinav Shrivastava, Abhinav Gupta และ Ross Girshick Training Region-based Object Detectors with Online Hard Example Mining (CVPR 2016)

  2. การสูญเสียโฟกัส:การปรับเปลี่ยนสำหรับการสูญเสียเอนโทรปีข้าม "วานิลลา" สามารถใช้เพื่อจัดการกับความไม่สมดุลของคลาสได้


โพสต์ที่เกี่ยวข้องนี้และนี้