我是否正确解释了 K-means 结果？

Question

我已经实现了 k-means 弯头 plot 来为我的数据找到最佳 K（在进行 PCA 之后）。 我得到了如下所示的弯头 plot。 我的问题是：我认为在我的情况下最佳 K 是 3（这是突然下降/拐点发生的地方）？ 但是看看我的 X_PCA_1 VS。 X_PCA_2 plot，我认为数据只能聚集成2个集群？ 还是我弄错了？

注意：我还是个初学者。

K型弯头

Answer 1

如果您想 plot 清楚地看到集群，首先您可以使用带有 3 个组件的 PCA：

pca = PCA(3)
X_pca = pca.fit_transform(scaled_df)

然后，您可以将 append 每个点指向每个维度：

X = []
Y = []
Z = []
for i in X_pca:
    X.append(i[0])
    Y.append(i[1])
    Z.append(i[2])

从这里您可以选择 plot 3d 图的库。

model = KMeans(n_clusters=3)
cluster_kmeans = model.fit_predict(scaled_df)

df_graph = pd.DataFrame({'X': X,
                         'Y': Y,
                         'Z': Z,
                         'labels': cluster_kmeans
                         })

fig = plt.figure(figsize=(20, 10))
ax = fig.add_subplot(111, projection='3d')

for s in df_graph.labels.unique():
    ax.scatter(df_graph.X[df_graph.labels==s],df_graph.Y[df_graph.labels==s],df_graph.Z[df_graph.labels==s],label=s)
    
ax.legend()
plt.show()

我是否正确解释了 K-means 结果？

问题描述

1 个解决方案

解决方案1
0 已采纳 2022-08-03 19:00:11

我是否正确解释了 K-means 结果？

问题描述

1 个解决方案

解决方案1 0 已采纳 2022-08-03 19:00:11

解决方案1
0 已采纳 2022-08-03 19:00:11