Divisi oleh $0$ Kasus Ekstrem di Fuzzy C-Means Clustering

Aug 15 2020

Saya punya pertanyaan tentang cara menghitung matriks partisi untuk Algoritma Pengelompokan Fuzzy C-Means (FCM). Untuk poin mana pun$x_i$ dan cluster centroid $c_j$, nilai keanggotaan $w_{i,j}$ dihitung dengan algoritma berikut (di mana c adalah jumlah cluster, m adalah hyper-parameter fuzziness, dan $\Vert \Vert$ adalah jarak Euclidean): $$w_{i,j}=\sum_{k=1}^c \frac{1}{\left(\frac{\Vert x_i-c_j\Vert}{\Vert x_i-c_k\Vert}\right)^{\frac{2}{m-1}}}$$ Secara teoritis (meskipun sangat tidak mungkin secara eksperimental), titik mana pun dapat memiliki jarak $0$ dari pusat massa mana pun, menyebabkan pembagian oleh $0$.

Solusinya tampak jelas bagi saya: jika $\Vert x_i-c_k\Vert=0$, lalu tunjuk $x_i$ terletak langsung di centroid $c_k$, jadi $w_{i,k}=1$ dan $w_{i,j}=0$ untuk semua j lainnya, mempertahankan persyaratan itu $\sum_{j=1}^c w_{i,j}=1$, tapi saya tidak yakin apakah ini terdengar sesuai dengan algoritme.

Jika poin $x_i$ terletak di centroid $c_j$, adalah $w_{i,j}=1$ benar?

(Hanya mencari beberapa verifikasi, saya tidak dapat menemukan apa pun di materi sumber yang saya lihat ...)

Jawaban

1 JMP Aug 15 2020 at 20:42

Ini adalah kasus khusus dari teorema dimana diasumsikan bahwa tidak $c_k=x_i$.

Makalah asli formula ini muncul adalah:

Kerabat Fuzzy dari Proses ISODATA dan Penggunaannya dalam Mendeteksi Kluster
Sibernetika dan Sistem yang Terpisah dengan Baik
. J.C.Dunn (1973)

Artikel tersebut dapat menemukannya:

https://www-m9.ma.tum.de/foswiki/pub/WS2010/CombOptSem/FCM.pdf

dan teorema adalah Teorema 3, (a) Kasus 1 pada halaman 44.