Phân chia theo $0$ Trường hợp cực đoan trong cụm C-Means mờ

Aug 15 2020

Tôi có câu hỏi về việc tính toán ma trận phân vùng cho Thuật toán phân cụm Mờ C-Means (FCM). Đối với bất kỳ điểm nào$x_i$ và cụm trung tâm $c_j$, giá trị thành viên $w_{i,j}$ được tính bằng thuật toán sau (trong đó c là số cụm, m là siêu tham số mờ và $\Vert \Vert$ là khoảng cách Euclide): $$w_{i,j}=\sum_{k=1}^c \frac{1}{\left(\frac{\Vert x_i-c_j\Vert}{\Vert x_i-c_k\Vert}\right)^{\frac{2}{m-1}}}$$ Về mặt lý thuyết (mặc dù rất khó xảy ra bằng thực nghiệm), bất kỳ điểm nào cũng có thể có khoảng cách $0$ từ bất kỳ trung tâm nào, gây ra sự phân chia theo $0$.

Giải pháp có vẻ rõ ràng đối với tôi: nếu $\Vert x_i-c_k\Vert=0$, sau đó chỉ $x_i$ nằm trực tiếp trên centroid $c_k$, vì thế $w_{i,k}=1$$w_{i,j}=0$ cho tất cả các j khác, duy trì yêu cầu $\sum_{j=1}^c w_{i,j}=1$, nhưng tôi không chắc liệu đây có phải là âm thanh theo thuật toán hay không.

Nếu điểm $x_i$ nằm trên centroid $c_j$, Là $w_{i,j}=1$ thật?

(Tôi chỉ đang tìm kiếm một số xác minh, tôi không thể tìm thấy bất cứ điều gì trong các tài liệu nguồn mà tôi đang xem ...)

Trả lời

1 JMP Aug 15 2020 at 20:42

Đây là một trường hợp đặc biệt của định lý khi giả định rằng không $c_k=x_i$.

Bài báo ban đầu xuất hiện công thức này là:

Tương đối mờ của quy trình ISODATA và việc sử dụng nó trong việc phát hiện các cụm
điều khiển học và hệ thống được phân tách rõ ràng
J. C. Dunn (1973)

Bài báo có thể tìm thấy cô ấy:

https://www-m9.ma.tum.de/foswiki/pub/WS2010/CombOptSem/FCM.pdf

và định lý là Định lý 3, (a) Trường hợp 1 ở trang 44.