Division par $0$ Cas extrême dans le clustering flou C-Means

Aug 15 2020

J'ai une question sur le calcul de la matrice de partition pour l'algorithme de clustering Fuzzy C-Means (FCM). Pour tout point$x_i$ et centre de gravité du cluster $c_j$, la valeur de l'adhésion $w_{i,j}$ est calculé par l'algorithme suivant (où c est le nombre de clusters, m est un hyper-paramètre de flou, et $\Vert \Vert$ est la distance euclidienne): $$w_{i,j}=\sum_{k=1}^c \frac{1}{\left(\frac{\Vert x_i-c_j\Vert}{\Vert x_i-c_k\Vert}\right)^{\frac{2}{m-1}}}$$ Théoriquement (bien que très peu probable expérimentalement), tout point pourrait avoir une distance de $0$ à partir de n'importe quel centre de gravité, provoquant une division par $0$.

La solution me paraît évidente: si $\Vert x_i-c_k\Vert=0$, puis pointez $x_i$ se trouve directement sur le centre de gravité $c_k$, alors $w_{i,k}=1$ et $w_{i,j}=0$ pour tous les autres j, en préservant l'exigence que $\sum_{j=1}^c w_{i,j}=1$, mais je ne suis pas sûr que ce soit le son selon l'algorithme.

Si le point $x_i$ se trouve sur le centre de gravité $c_j$, est $w_{i,j}=1$ vrai?

(Juste à la recherche d'une vérification, je n'ai rien trouvé dans les documents sources que je regardais ...)

Réponses

1 JMP Aug 15 2020 at 20:42

C'est un cas particulier du théorème où l'on suppose que non $c_k=x_i$.

L'article original dans lequel cette formule est apparue est:

Un relatif flou du processus ISODATA et son utilisation dans la détection de clusters compacts bien séparés
Cybernétique et systèmes
J. C. Dunn (1973)

L'article peut être trouvé elle:

https://www-m9.ma.tum.de/foswiki/pub/WS2010/CombOptSem/FCM.pdf

et le théorème est le Théorème 3, (a) Cas 1 à la page 44.