หารโดย $0$ กรณีที่รุนแรงในการจัดกลุ่ม C-mean แบบคลุมเครือ
ฉันมีคำถามเกี่ยวกับการคำนวณพาร์ติชันเมทริกซ์สำหรับอัลกอริทึมการทำคลัสเตอร์ Fzzy C-Means (FCM) สำหรับจุดใด ๆ$x_i$ และคลัสเตอร์เซนทรอยด์ $c_j$, มูลค่าสมาชิก $w_{i,j}$ คำนวณโดยอัลกอริทึมต่อไปนี้ (โดยที่ c คือจำนวนคลัสเตอร์ m คือพารามิเตอร์ไฮเปอร์ฟัซซิเนสและ $\Vert \Vert$ คือระยะทางแบบยุคลิด): $$w_{i,j}=\sum_{k=1}^c \frac{1}{\left(\frac{\Vert x_i-c_j\Vert}{\Vert x_i-c_k\Vert}\right)^{\frac{2}{m-1}}}$$ ในทางทฤษฎี (แม้ว่าจะไม่น่าเป็นไปได้มากในการทดลอง) จุดใด ๆ อาจมีระยะห่าง $0$ จากเซนทรอยด์ใด ๆ ทำให้เกิดการหารด้วย $0$.
วิธีแก้ปัญหาดูเหมือนชัดเจนสำหรับฉัน: ถ้า $\Vert x_i-c_k\Vert=0$แล้วชี้ $x_i$ อยู่บนเซนทรอยด์โดยตรง $c_k$ดังนั้น $w_{i,k}=1$ และ $w_{i,j}=0$ สำหรับ j อื่น ๆ ทั้งหมดรักษาข้อกำหนดที่ว่า $\sum_{j=1}^c w_{i,j}=1$แต่ฉันไม่แน่ใจว่านี่เป็นเสียงตามอัลกอริทึมหรือเปล่า
ถ้าจุด $x_i$ อยู่บนเซนทรอยด์ $c_j$, คือ $w_{i,j}=1$ จริงหรือ?
(เพียงแค่ต้องการการตรวจสอบบางอย่างฉันไม่พบสิ่งใดในแหล่งข้อมูลที่ฉันกำลังดู ... )
คำตอบ
นี่เป็นกรณีพิเศษของทฤษฎีบทที่สันนิษฐานว่าไม่ใช่ $c_k=x_i$.
กระดาษต้นฉบับที่สูตรนี้ปรากฏคือ:
ความสัมพันธ์ที่คลุมเครือของกระบวนการ ISODATA และการใช้ในการตรวจจับคลัสเตอร์ขนาดกะทัดรัดที่แยกกันอย่างดี
ไซเบอร์เนติกส์และระบบ
J. C. Dunn (1973)
บทความนี้สามารถพบได้:
https://www-m9.ma.tum.de/foswiki/pub/WS2010/CombOptSem/FCM.pdf
และทฤษฎีบทคือทฤษฎีบท 3, (ก) กรณีที่ 1 ในหน้า 44