簡體 English 中英

Scikit學習KMeans聚類-使具有X特征的聚類適合您，預測具有X-1特征的聚類成員資格？

[英]Scikit-learn KMeans clustering - fit cluster with X features, predict cluster membership with X-1 features?

原文 2015-01-29 14:58:48 7 2 python/ scikit-learn/ cluster-analysis/ k-means

我目前正在嘗試使用KMeans聚類解決某種回歸任務（預測“ count”字段的值）。 這個想法很簡單：

在我的測試數據集上擬合聚類：

 k_means = cluster.KMeans(n_clusters=4, n_init = 20, init='random')
 k_means.fit(df[['DistanceToMidnight','season','DayType','weather','temp','atemp','humidity','windspeed','count']])

*請注意，我在群集中確實使用了“計數”。

然后，我想使用我的測試集（除了沒有“ count”字段外，其他基本相同）-我想使用除“ count”之外的所有功能確定集群成員身份，然后將“ count”分配給測試中的每一行設置為分配的群集中心的“計數”相關坐標。

有什么想法如何使用KMeans集群的標准功能簡單地做到這一點？ 我不能只調用“ k_means.predict”，因為由於功能編號不匹配，它將失敗。

我能想到的最簡單的方法是使用已訓練的聚類提供的聚類中心來構建k_means聚類對象。 但是我不確定該怎么做。 是否可以通過為其提供已定義的群集質心來創建新的cluster.KMeans對象？

2 個解決方案

查找最近的集群中心
使用中心缺失的值

如果您遵循k均值原理，則最佳預測值是分配給中心的值； 除非您分別為每個集群建立回歸模型。

您可以首先使用K均值計算所有質心。 然后計算從sklearn.metrics到每個點到所有質心的歐幾里得距離（除了要排除的質心）。 最后，獲得使每個點的距離（沿着第二軸的np.argmin ）最小的聚類。

scikit-learn：查找有助於每個 KMeans 集群的特征

[英]scikit-learn: Finding the features that contribute to each KMeans cluster

KMeans聚類后的聚類點（scikit learn）

[英]cluster points after KMeans clustering (scikit learn)

Scikit學習kmeans聚類

[英]Scikit-learn kmeans clustering

使用 Scikit-learn KMeans 聚類多維 arrays

[英]Using Scikit-learn KMeans to cluster multi-dimensional arrays

如何從scikit-learn KMeans獲取集群中心的文本？

[英]How to get the text of cluster centers from scikit-learn KMeans?

用於scikit-learn kmeans聚類的初始質心

[英]initial centroids for scikit-learn kmeans clustering

使用scikit-learn DBSCAN獲取集群成員/元素集群

[英]Get cluster members/elements clustering with scikit-learn DBSCAN

在KMeans聚類之后查找聚類的長度（與聚類關聯的點數）（scikit learn）

[英]Find length of cluster (how many point associated with cluster) after KMeans clustering (scikit learn)

使用scikit-learn預測給定“y”的數據向量“x”？

[英]Use scikit-learn to predict data vector “x” given “y”?

如何向scikit學習DictVectorizer添加功能？

[英]How to add features to scikit-learn DictVectorizer?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 scikit-learn：查找有助於每個 KMeans 集群的特征 KMeans聚類后的聚類點（scikit learn） Scikit學習kmeans聚類使用 Scikit-learn KMeans 聚類多維 arrays 如何從scikit-learn KMeans獲取集群中心的文本？用於scikit-learn kmeans聚類的初始質心使用scikit-learn DBSCAN獲取集群成員/元素集群在KMeans聚類之后查找聚類的長度（與聚類關聯的點數）（scikit learn）使用scikit-learn預測給定“y”的數據向量“x”？如何向scikit學習DictVectorizer添加功能？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM