Divisione per $0$ Caso estremo nel clustering Fuzzy C-Means
Ho una domanda sul calcolo della matrice di partizione per l'algoritmo di clustering Fuzzy C-Means (FCM). Per qualsiasi punto$x_i$ e il centroide del cluster $c_j$, il valore dell'appartenenza $w_{i,j}$ è calcolato dal seguente algoritmo (dove c è il numero di cluster, m è un iperparametro di fuzziness e $\Vert \Vert$ è la distanza euclidea): $$w_{i,j}=\sum_{k=1}^c \frac{1}{\left(\frac{\Vert x_i-c_j\Vert}{\Vert x_i-c_k\Vert}\right)^{\frac{2}{m-1}}}$$ Teoricamente (anche se molto improbabile sperimentalmente), qualsiasi punto potrebbe avere una distanza di $0$ da qualsiasi centroide, causando una divisione per $0$.
La soluzione mi sembra ovvia: se $\Vert x_i-c_k\Vert=0$, quindi indica $x_i$ si trova direttamente sul centroide $c_k$, così $w_{i,k}=1$ e $w_{i,j}=0$ per tutti gli altri j, preservando il requisito che $\sum_{j=1}^c w_{i,j}=1$, ma non sono sicuro che questo sia il suono secondo l'algoritmo.
Se punto $x_i$ giace sul centroide $c_j$, è $w_{i,j}=1$ vero?
(Sto solo cercando una verifica, non sono riuscito a trovare nulla nei materiali di origine che stavo visualizzando ...)
Risposte
Questo è un caso speciale del teorema dove si presume che no $c_k=x_i$.
Il documento originale in cui è apparsa questa formula è:
Un parente sfocato del processo ISODATA e il suo utilizzo nella rilevazione di cluster
e sistemi cibernetici compatti ben separati
J. C. Dunn (1973)
L'articolo può essere trovato qui:
https://www-m9.ma.tum.de/foswiki/pub/WS2010/CombOptSem/FCM.pdf
e il teorema è Teorema 3, (a) Caso 1 a pagina 44.