簡體   English   中英

使用具有L方法的平滑器來確定K-Means簇的數量

[英]Using a smoother with the L Method to determine the number of K-Means clusters

在應用L方法確定數據集中k-means聚類的數量之前,是否有人嘗試將更平滑的應用程序應用於評估指標? 如果是這樣,它是否改善了結果? 或者允許更少數量的k-means試驗,從而大大提高速度? 您使用了哪種平滑算法/方法?

“L-Method”詳述如下: 確定分層聚類/分段算法中的聚類/分段數 ,Salvador&Chan

這將計算一系列不同試驗群集計數的評估指標。 然后,為了找到膝蓋(出現最佳簇數),使用線性回歸擬合兩條線。 應用簡單的迭代過程來改善膝蓋擬合 - 這使用現有的評估度量計算,並且不需要重新運行k均值。

對於評估指標,我使用的是Dunns指數的簡化版本的倒數。 簡化速度(基本上我的直徑和簇間計算得到簡化)。 倒數使得指數在正確的方向上工作(即,通常更好)。

K-means是一種隨機算法,因此通常會多次運行並選擇最佳擬合。 這非常有效,但是當您為1..N群集執行此操作時,時間會快速累加。 因此,控制運行次數符合我的利益。 整體處理時間可能決定我的實現是否實用 - 如果我無法加速,我可能會拋棄此功能。

我過去曾在SO上問了一個類似的問題 我的問題是如何找到一種找到你描述的L形膝蓋的一致方法。 所討論的曲線代表了復雜性與模型擬合度量之間的權衡。

最好的解決方案是根據顯示的圖找到最大距離為d的點:

替代文字

注意:我還沒看過您鏈接的論文..

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM