簡體 English 中英

使用具有L方法的平滑器來確定K-Means簇的數量

[英]Using a smoother with the L Method to determine the number of K-Means clusters

原文 2010-10-27 13:35:54 0 1 algorithm/ cluster-analysis/ k-means/ linear-regression

在應用L方法確定數據集中k-means聚類的數量之前，是否有人嘗試將更平滑的應用程序應用於評估指標？ 如果是這樣，它是否改善了結果？ 或者允許更少數量的k-means試驗，從而大大提高速度？ 您使用了哪種平滑算法/方法？

這將計算一系列不同試驗群集計數的評估指標。 然后，為了找到膝蓋（出現最佳簇數），使用線性回歸擬合兩條線。 應用簡單的迭代過程來改善膝蓋擬合 - 這使用現有的評估度量計算，並且不需要重新運行k均值。

對於評估指標，我使用的是Dunns指數的簡化版本的倒數。 簡化速度（基本上我的直徑和簇間計算得到簡化）。 倒數使得指數在正確的方向上工作（即，通常更好）。

K-means是一種隨機算法，因此通常會多次運行並選擇最佳擬合。 這非常有效，但是當您為1..N群集執行此操作時，時間會快速累加。 因此，控制運行次數符合我的利益。 整體處理時間可能決定我的實現是否實用 - 如果我無法加速，我可能會拋棄此功能。

我過去曾在SO上問了一個類似的問題。 我的問題是如何找到一種找到你描述的L形膝蓋的一致方法。 所討論的曲線代表了復雜性與模型擬合度量之間的權衡。

最好的解決方案是根據顯示的圖找到最大距離為d的點：

替代文字

注意：我還沒看過您鏈接的論文..

K-Means用於對角線聚類

[英]K-Means for diagonal clusters

[英]Clustering with uneven clusters (k-means)

[英]Need to compare the K-means clusters similarity

[英]Choosing number of clusters in k means

[英]k-means initial centers determine the result?

[英]Using stemming in K-Means clustering

[英]How to store Hierarchical K-Means tree for a large number of images, using Opencv?

[英]Creating clusters with K-means plus plus clustering algorithm based on connected distance

[英]Same result from K-means and sequential K-means?

[英]K-Means Clustering Paritioning

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 K-Means用於對角線聚類聚類與不均勻聚類（k均值）需要比較 K-means 聚類相似度以k表示選擇簇數 k-means初始中心確定結果？在K-Means聚類中使用詞干如何使用Opencv存儲大量圖像的Hierarchical K-Means樹？根據連接距離，使用K-means plus plus聚類算法創建聚類 K均值和順序K均值的結果相同嗎？ K均值聚類划分

相關標簽