[英]Clustering with scikit-learn
我是第一次与scikit-learn合作,并试图建立kmeans集群。 我想我做的一切正确。
我在数据帧df
有一个日期时间索引和2列整数。
kmeans = KMeans(n_clusters=2)
kmeans.fit(df.values)
然后,我有另一组看起来相同的数据,我想对其进行预测。 所以我将df1
传递给kmeans.predict()
。
我是否需要在每个这些数据框中添加一些列以进行分类? 我假设我投入的一切都很好。
完成分类后,如何在图表中将其可视化?
谢谢
在不查看数据的情况下,并且假设您希望将结果预测作为第二个数据(df2)帧中的一列,您可以使用.apply()函数并指定垂直轴来应用kn.predict()。 这将为您提供带有预测输出的附加列。
即
df2['predictions'] = df2['values'].apply(kmeans.predict)
这是适用的信息。 http://pandas.pydata.org/pandas-docs/version/0.17.1/generated/pandas.DataFrame.apply.html
希望能有所帮助。 需要帮助请叫我。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.