簡體   English   中英

需要比較 K-means 聚類相似度

[英]Need to compare the K-means clusters similarity

我需要比較聚類相似性,但聚類技術會產生長度不相等的聚類。

假設我有 4 個數據點 A、B、C 和 D。並假設這些數據集是一段時間內的變化。 我在第一個小時內對這些數據運行 KMeans 聚類並得到 3 個聚類 [(A, B),(C),(D)]。 然后我在第二個小時再次對這些數據運行 KMeans 聚類,並獲得另外 3 個聚類 [(B, C),(A),(D)] 等等。

我需要通過將第一個小時的集群與第二個小時的集群進行比較來衡量這些集群隨時間的變化,並分配相似度分數。

例如:

第一個小時的第三個集群與第二個小時的第三個集群更相似,100%,這里沒有問題,但問題是我如何衡量其他人。

1-(A,B)一起開始然后他們分散,如果說(A,B)就像(B,C)有50%。

2- 我將無法在 (A, B) 與 (A) 和 (C) 與 (A, B) 之間分配分數,因為它們的長度不同,如果按照計算它們的方法,我將獲得多個相似的分數.

如果有人有解決這個問題的想法。

檢查這個想法,看看它是否有效:1-運行 k-mean 聚類並在您想要的任何時間段保存質心 2-通過測量質心的運動,您可以每小時比較一次

希望它會有所幫助!

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM