![](/img/trans.png)
[英]R clustering results not as expected - have i misunderstood/misused anything?
[英]How to force a clustering algorithm to match expected results?
我有2個具有多個變量的數據集(data_A和data_B)。 有2個可能的輸出(pheno_1和pheno_2)。 我知道data_A的pheno_1幾乎為100%,data_B的pheno_1約為50%。 但是數據集未標記。 我正在尋找一種聚類或分類算法,以使其與我的預期結果相匹配的方式對我的數據進行聚類。 然后,我將使用聚類預測不同數據集的輸出。
到目前為止,我正在使用K-Means並嘗試使用不同的變量集和不同的規范化方法,以獲得最終結果。 我想找出一個“自動”方法,嘗試不同的組合,直到找到我想要的東西為止。
目前沒有代碼顯示。
在R軟件包ConsensusClusterPlus中,他們使發現簇的過程自動化,從而消除了K均值的隨機性,並測試了多個K值。
當涉及到您的問題時,我建議:
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.