使用scikit-learn进行聚类

Question

我是第一次与scikit-learn合作，并试图建立kmeans集群。 我想我做的一切正确。

我在数据帧df有一个日期时间索引和2列整数。

kmeans = KMeans(n_clusters=2)
kmeans.fit(df.values)

然后，我有另一组看起来相同的数据，我想对其进行预测。 所以我将df1传递给kmeans.predict() 。

我是否需要在每个这些数据框中添加一些列以进行分类？ 我假设我投入的一切都很好。

完成分类后，如何在图表中将其可视化？

谢谢

Answer 1

在不查看数据的情况下，并且假设您希望将结果预测作为第二个数据（df2）帧中的一列，您可以使用.apply（）函数并指定垂直轴来应用kn.predict（）。 这将为您提供带有预测输出的附加列。

即

df2['predictions'] = df2['values'].apply(kmeans.predict)

这是适用的信息。 http://pandas.pydata.org/pandas-docs/version/0.17.1/generated/pandas.DataFrame.apply.html

希望能有所帮助。 需要帮助请叫我。