Division durch $0$ Extremfall bei Fuzzy-C-Means-Clustering

Aug 15 2020

Ich habe eine Frage zur Berechnung der Partitionsmatrix für den FCM-Clustering-Algorithmus (Fuzzy C-Means). Für jeden Punkt$x_i$ und Cluster-Schwerpunkt $c_j$, der Mitgliedswert $w_{i,j}$ wird durch den folgenden Algorithmus berechnet (wobei c die Anzahl der Cluster ist, m ein Fuzziness-Hyperparameter ist und $\Vert \Vert$ ist euklidischer Abstand): $$w_{i,j}=\sum_{k=1}^c \frac{1}{\left(\frac{\Vert x_i-c_j\Vert}{\Vert x_i-c_k\Vert}\right)^{\frac{2}{m-1}}}$$ Theoretisch (obwohl experimentell sehr unwahrscheinlich) könnte jeder Punkt einen Abstand von haben $0$ von jedem Schwerpunkt, verursacht eine Division durch $0$.

Die Lösung scheint mir offensichtlich: wenn $\Vert x_i-c_k\Vert=0$dann zeigen $x_i$ liegt direkt am Schwerpunkt $c_k$, damit $w_{i,k}=1$ und $w_{i,j}=0$ für alle anderen j unter Beibehaltung der Anforderung, dass $\sum_{j=1}^c w_{i,j}=1$, aber ich bin mir nicht sicher, ob dies nach dem Algorithmus klingt.

Wenn Punkt $x_i$ liegt auf Schwerpunkt $c_j$ist $w_{i,j}=1$ wahr?

(Nur auf der Suche nach einer Bestätigung konnte ich in den Quellmaterialien, die ich mir ansah, nichts finden ...)

Antworten

1 JMP Aug 15 2020 at 20:42

Dies ist ein Sonderfall des Satzes, bei dem angenommen wird, dass nein $c_k=x_i$.

Das Originalpapier, in dem diese Formel erschien, ist:

Ein Fuzzy-Verwandter des ISODATA-Prozesses und seiner Verwendung zum Nachweis kompakter, gut getrennter Cluster
Kybernetik und Systeme
J. C. Dunn (1973)

Der Artikel kann sie gefunden werden:

https://www-m9.ma.tum.de/foswiki/pub/WS2010/CombOptSem/FCM.pdf

und der Satz ist Satz 3, (a) Fall 1 auf Seite 44.