簡體   English   中英

在 R 中聚類分類值

[英]Clustering Categorical Values in R

我需要對混合數據進行聚類(2 列:1 - 數字和 2 - 字符串)。 R 或 python 中是否有一個包可以處理混合數據或分類數據的聚類?

謝謝!

對於 RI,建議使用cluster包中的daisy功能。

您可以擁有一個混合數據類型的matrix ,即名義-序數-數字。

如果數據是混合的,它會計算每個變量的gower距離,基本上每個標稱值都被轉換為數字,並通過每個變量的加權平均值來衡量差異。

即使所有變量都是數字,也可以使用它,在這種情況下,它將使用標准指標。

有關更多信息和示例,請參閱幫助頁面

這里介紹高爾距離。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM