Division durch $0$ Extremfall bei Fuzzy-C-Means-Clustering
Ich habe eine Frage zur Berechnung der Partitionsmatrix für den FCM-Clustering-Algorithmus (Fuzzy C-Means). Für jeden Punkt$x_i$ und Cluster-Schwerpunkt $c_j$, der Mitgliedswert $w_{i,j}$ wird durch den folgenden Algorithmus berechnet (wobei c die Anzahl der Cluster ist, m ein Fuzziness-Hyperparameter ist und $\Vert \Vert$ ist euklidischer Abstand): $$w_{i,j}=\sum_{k=1}^c \frac{1}{\left(\frac{\Vert x_i-c_j\Vert}{\Vert x_i-c_k\Vert}\right)^{\frac{2}{m-1}}}$$ Theoretisch (obwohl experimentell sehr unwahrscheinlich) könnte jeder Punkt einen Abstand von haben $0$ von jedem Schwerpunkt, verursacht eine Division durch $0$.
Die Lösung scheint mir offensichtlich: wenn $\Vert x_i-c_k\Vert=0$dann zeigen $x_i$ liegt direkt am Schwerpunkt $c_k$, damit $w_{i,k}=1$ und $w_{i,j}=0$ für alle anderen j unter Beibehaltung der Anforderung, dass $\sum_{j=1}^c w_{i,j}=1$, aber ich bin mir nicht sicher, ob dies nach dem Algorithmus klingt.
Wenn Punkt $x_i$ liegt auf Schwerpunkt $c_j$ist $w_{i,j}=1$ wahr?
(Nur auf der Suche nach einer Bestätigung konnte ich in den Quellmaterialien, die ich mir ansah, nichts finden ...)
Antworten
Dies ist ein Sonderfall des Satzes, bei dem angenommen wird, dass nein $c_k=x_i$.
Das Originalpapier, in dem diese Formel erschien, ist:
Ein Fuzzy-Verwandter des ISODATA-Prozesses und seiner Verwendung zum Nachweis kompakter, gut getrennter Cluster
Kybernetik und Systeme
J. C. Dunn (1973)
Der Artikel kann sie gefunden werden:
https://www-m9.ma.tum.de/foswiki/pub/WS2010/CombOptSem/FCM.pdf
und der Satz ist Satz 3, (a) Fall 1 auf Seite 44.