簡體   English   中英

以k表示選擇簇數

[英]Choosing number of clusters in k means

我想聚類大量數據,為此我在MATLAB中使用了k均值函數。 問題是它返回一個矩陣,其中所有數據都按我指定的簇數排序。

我怎么知道哪個簇是最佳的。

我以為,如果我在每個群集中得到相等數量的元素,那將是最佳選擇,但這永遠不會發生。 相反,它可以繼續對我輸入的任何數字進行數據聚類。

請幫忙...

我讀了一下,我認為對此的答案可能是:-在kmeans中,我們試圖根據數據出現時的方式對數據進行分區,因此從理論上講,我們最好的數據集將是每個分區具有相等數量的數據。

我使用kmeans ++是一種比kmeans更好的算法,因為它不初始化隨機值,然后遍歷分區的數量直到分區的大小幾乎相等。 這是一個大概的數字,比如說3我得到2180,729,1219,而4我得到30,2422,1556,120,所以我選擇3作為我的最終答案.......

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM