如何從在Python的分層聚類中形成的聚類中創建數據集？

Question

我已經使用層次化集群形成了集群，並且希望將這些單獨的集群分別存儲在數據集中以進行進一步處理，但是我不知道該怎么做。

Z = linkage(df, 'ward', metric='euclidean')

創建樹狀圖

plt.figure(figsize=(50, 10))
plt.title('Hierarchical Clustering Dendrogram')
plt.xlabel('sample index')
plt.ylabel('distance')
dendrogram(Z, leaf_rotation=90., leaf_font_size=8.,)
plt.show()

樹狀圖

截斷集群

plt.title('Hierarchical Clustering Dendrogram (truncated)')
plt.xlabel('sample index or (cluster size)')
plt.ylabel('distance')
dendrogram(Z, truncate_mode='lastp', p=12, leaf_rotation=90., leaf_font_size=12.,)
plt.axhline(y=5000, color='r', linestyle='--')
plt.show()

截斷的樹狀圖

現在，我想知道如何分別保存四個群集或如何將它們分開？

Answer 1

使用任何一種聚類方法進一步創建聚類

from sklearn.cluster import AgglomerativeClustering
cluster = AgglomerativeClustering(n_clusters=4, affinity='euclidean', linkage='ward')  
cl = cluster.fit_predict(df)

然后將這些群集保存在原始數據框中

df['Cluster'] = cl

如何從在Python的分層聚類中形成的聚類中創建數據集？

問題描述

創建樹狀圖

截斷集群

1 個解決方案

解決方案1
0 2019-07-26 12:04:03

使用任何一種聚類方法進一步創建聚類

然后將這些群集保存在原始數據框中

現在您可以根據集群的值對其進行排序

如何從在Python的分層聚類中形成的聚類中創建數據集？

問題描述

創建樹狀圖

截斷集群

1 個解決方案

解決方案1 0 2019-07-26 12:04:03

使用任何一種聚類方法進一步創建聚類

然后將這些群集保存在原始數據框中

現在您可以根據集群的值對其進行排序

解決方案1
0 2019-07-26 12:04:03