Divisi oleh $0$ Kasus Ekstrem di Fuzzy C-Means Clustering
Saya punya pertanyaan tentang cara menghitung matriks partisi untuk Algoritma Pengelompokan Fuzzy C-Means (FCM). Untuk poin mana pun$x_i$ dan cluster centroid $c_j$, nilai keanggotaan $w_{i,j}$ dihitung dengan algoritma berikut (di mana c adalah jumlah cluster, m adalah hyper-parameter fuzziness, dan $\Vert \Vert$ adalah jarak Euclidean): $$w_{i,j}=\sum_{k=1}^c \frac{1}{\left(\frac{\Vert x_i-c_j\Vert}{\Vert x_i-c_k\Vert}\right)^{\frac{2}{m-1}}}$$ Secara teoritis (meskipun sangat tidak mungkin secara eksperimental), titik mana pun dapat memiliki jarak $0$ dari pusat massa mana pun, menyebabkan pembagian oleh $0$.
Solusinya tampak jelas bagi saya: jika $\Vert x_i-c_k\Vert=0$, lalu tunjuk $x_i$ terletak langsung di centroid $c_k$, jadi $w_{i,k}=1$ dan $w_{i,j}=0$ untuk semua j lainnya, mempertahankan persyaratan itu $\sum_{j=1}^c w_{i,j}=1$, tapi saya tidak yakin apakah ini terdengar sesuai dengan algoritme.
Jika poin $x_i$ terletak di centroid $c_j$, adalah $w_{i,j}=1$ benar?
(Hanya mencari beberapa verifikasi, saya tidak dapat menemukan apa pun di materi sumber yang saya lihat ...)
Jawaban
Ini adalah kasus khusus dari teorema dimana diasumsikan bahwa tidak $c_k=x_i$.
Makalah asli formula ini muncul adalah:
Kerabat Fuzzy dari Proses ISODATA dan Penggunaannya dalam Mendeteksi Kluster
Sibernetika dan Sistem yang Terpisah dengan Baik
. J.C.Dunn (1973)
Artikel tersebut dapat menemukannya:
https://www-m9.ma.tum.de/foswiki/pub/WS2010/CombOptSem/FCM.pdf
dan teorema adalah Teorema 3, (a) Kasus 1 pada halaman 44.