Деление по $0$ Экстремальный случай в кластеризации нечетких C-средних

Aug 15 2020

У меня вопрос о вычислении матрицы разделения для алгоритма кластеризации нечетких C-средних (FCM). Для любой точки$x_i$ и центроид кластера $c_j$, значение членства $w_{i,j}$ вычисляется по следующему алгоритму (где c - количество кластеров, m - гиперпараметр нечеткости, и $\Vert \Vert$ - евклидово расстояние): $$w_{i,j}=\sum_{k=1}^c \frac{1}{\left(\frac{\Vert x_i-c_j\Vert}{\Vert x_i-c_k\Vert}\right)^{\frac{2}{m-1}}}$$ Теоретически (хотя экспериментально это маловероятно) любая точка может иметь расстояние $0$ от любого центроида, вызывая деление на $0$.

Решение мне кажется очевидным: если $\Vert x_i-c_k\Vert=0$, затем укажите $x_i$ лежит прямо на центроиде $c_k$, так $w_{i,k}=1$ и $w_{i,j}=0$ для всех остальных j, сохраняя требование, чтобы $\sum_{j=1}^c w_{i,j}=1$, но я не уверен, что это звучит по алгоритму.

Если точка $x_i$ лежит на центроиде $c_j$, является $w_{i,j}=1$ правда?

(Просто ищу подтверждение, я ничего не нашел в просматриваемых исходных материалах ...)

Ответы

1 JMP Aug 15 2020 at 20:42

Это частный случай теоремы, где предполагается, что нет $c_k=x_i$.

Оригинальная статья, в которой появилась эта формула, такова:

Нечеткий родственник процесса ISODATA и его использование в обнаружении компактных хорошо разделенных кластеров
Кибернетика и системы
Дж. К. Данн (1973)

В статье ее можно найти:

https://www-m9.ma.tum.de/foswiki/pub/WS2010/CombOptSem/FCM.pdf

и это теорема 3, (а) Случай 1 на стр. 44.