Divisão por $0$ Caso Extremo em Clustering Fuzzy C-Means

Aug 15 2020

Tenho uma pergunta sobre como calcular a matriz de partição para o algoritmo de agrupamento Fuzzy C-Means (FCM). Para qualquer ponto$x_i$ e centróide de cluster $c_j$, o valor da associação $w_{i,j}$ é calculado pelo seguinte algoritmo (onde c é o número de clusters, m é um hiperparâmetro de fuzziness, e $\Vert \Vert$ é a distância euclidiana): $$w_{i,j}=\sum_{k=1}^c \frac{1}{\left(\frac{\Vert x_i-c_j\Vert}{\Vert x_i-c_k\Vert}\right)^{\frac{2}{m-1}}}$$ Teoricamente (embora muito improvável experimentalmente), qualquer ponto poderia ter uma distância de $0$ de qualquer centróide, causando uma divisão por $0$.

A solução parece óbvia para mim: se $\Vert x_i-c_k\Vert=0$, então aponte $x_i$ encontra-se diretamente no centróide $c_k$, então $w_{i,k}=1$ e $w_{i,j}=0$ para todos os outros j, preservando a exigência de que $\sum_{j=1}^c w_{i,j}=1$, mas não tenho certeza se isso é bom de acordo com o algoritmo.

Se ponto $x_i$ encontra-se no centróide $c_j$, é $w_{i,j}=1$ verdadeiro?

(Apenas procurando alguma verificação, não consegui encontrar nada nos materiais de origem que estava vendo ...)

Respostas

1 JMP Aug 15 2020 at 20:42

Este é um caso especial do teorema onde se assume que não $c_k=x_i$.

O artigo original em que esta fórmula apareceu é:

Um parente difuso do processo ISODATA e seu uso na detecção de clusters compactos bem separados,
cibernética e sistemas
J. C. Dunn (1973)

O artigo pode ser encontrado nela:

https://www-m9.ma.tum.de/foswiki/pub/WS2010/CombOptSem/FCM.pdf

e o teorema é o Teorema 3, (a) Caso 1 na página 44.