簡體   English   中英

Scikit學習KMeans聚類-使具有X特征的聚類適合您,預測具有X-1特征的聚類成員資格?

[英]Scikit-learn KMeans clustering - fit cluster with X features, predict cluster membership with X-1 features?

我目前正在嘗試使用KMeans聚類解決某種回歸任務(預測“ count”字段的值)。 這個想法很簡單:

在我的測試數據集上擬合聚類:

 k_means = cluster.KMeans(n_clusters=4, n_init = 20, init='random')
 k_means.fit(df[['DistanceToMidnight','season','DayType','weather','temp','atemp','humidity','windspeed','count']])

*請注意,我在群集中確實使用了“計數”。

然后,我想使用我的測試集(除了沒有“ count”字段外,其他基本相同)-我想使用除“ count”之外的所有功能確定集群成員身份,然后將“ count”分配給測試中的每一行設置為分配的群集中心的“計數”相關坐標。

有什么想法如何使用KMeans集群的標准功能簡單地做到這一點? 我不能只調用“ k_means.predict”,因為由於功能編號不匹配,它將失敗。

我能想到的最簡單的方法是使用已訓練的聚類提供的聚類中心來構建k_means聚類對象。 但是我不確定該怎么做。 是否可以通過為其提供已定義的群集質心來創建新的cluster.KMeans對象?

  1. 查找最近的集群中心
  2. 使用中心缺失的值

如果您遵循k均值原理,則最佳預測值是分配給中心的值; 除非您分別為每個集群建立回歸模型。

您可以首先使用K均值計算所有質心。 然后計算從sklearn.metrics到每個點到所有質心的歐幾里得距離(除了要排除的質心)。 最后,獲得使每個點的距離(沿着第二軸的np.argmin )最小的聚類。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM