Podział według $0$ Ekstremalny przypadek w rozmytym klastrach C-średnich

Aug 15 2020

Mam pytanie dotyczące obliczenia macierzy partycji dla algorytmu klastrowania Fuzzy C-Means (FCM). W każdym momencie$x_i$ i środek ciężkości klastra $c_j$, wartość członkostwa $w_{i,j}$ jest obliczana przez następujący algorytm (gdzie c to liczba klastrów, m to hiperparametr rozmywania, a $\Vert \Vert$ odległość euklidesowa): $$w_{i,j}=\sum_{k=1}^c \frac{1}{\left(\frac{\Vert x_i-c_j\Vert}{\Vert x_i-c_k\Vert}\right)^{\frac{2}{m-1}}}$$ Teoretycznie (choć eksperymentalnie mało prawdopodobne), każdy punkt może mieć odległość równą $0$ z dowolnego środka ciężkości, powodując podział przez $0$.

Rozwiązanie wydaje mi się oczywiste: jeśli $\Vert x_i-c_k\Vert=0$, a następnie wskaż $x_i$ leży bezpośrednio na centroidzie $c_k$, więc $w_{i,k}=1$ i $w_{i,j}=0$ dla wszystkich innych j, zachowując wymaganie, że $\sum_{j=1}^c w_{i,j}=1$, ale nie jestem pewien, czy to brzmi zgodnie z algorytmem.

Jeśli punkt $x_i$ leży na centroidzie $c_j$, jest $w_{i,j}=1$ prawdziwe?

(Szukam tylko weryfikacji, nie mogłem znaleźć niczego w przeglądanych materiałach źródłowych ...)

Odpowiedzi

1 JMP Aug 15 2020 at 20:42

Jest to szczególny przypadek twierdzenia, w którym zakłada się, że nie $c_k=x_i$.

Oryginalny artykuł, w którym pojawił się ten wzór, to:

Rozmyty związek z procesem ISODATA i jego zastosowaniem w wykrywaniu kompaktowych dobrze rozdzielonych klastrów
Cybernetyka i systemy
J. C. Dunn (1973)

W artykule można ją znaleźć:

https://www-m9.ma.tum.de/foswiki/pub/WS2010/CombOptSem/FCM.pdf

a twierdzeniem jest Twierdzenie 3, (a) Przypadek 1 na stronie 44.