[英]Choosing the cluster values in k means algorithm
我正在編寫ak意味着算法,它接受一個double [] []來存儲位置並返回兩個位置集群。
我只是有一個非常快速的問題: 選擇初始簇值應該是什么的最佳方法是什么?
我試過隨機化這些值,但這並不總是很好用,我在網上找不到這個問題的好答案。 任何幫助深表感謝。
通常比隨機選擇更有效的一種流行策略是隨機選取第一個值,然后通過從第一個選擇中找到最遠的數據點來選擇第二個值。
然后將選擇下一個值與前兩個值相距最遠,依此類推。
這類似於稍微復雜的初始化算法K-means ++ 。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.