簡體 English 中英

kmeans scikit學習教程

[英]kmeans scikit-learn tutorial

原文 2014-04-01 03:22:01 3 2 python/ numpy/ scipy/ scikit-learn

我正在嘗試使用Python而不是R進行數據分析，並且遇到了一些麻煩。 因此，我一直在閱讀scikit-learn的文檔，並嘗試自己運行kmeans示例，但收到以下錯誤消息：

使用稀疏矢量化器Traceback（最近一次通話最后一次）從訓練數據集中提取特征：

X = vectorizer.fit_transform（dataset.data）中的文件“ kmeans.py”，第104行

文件“ /Library/Python/2.7/site-packages/scikit_learn-0.15_git-py2.7-macosx-10.9-intel.egg/sklearn/feature_extraction/text.py”，行1238，在fit_transform中返回self._tfidf.transform （X，copy = False）

文件“ /Library/Python/2.7/site-packages/scikit_learn-0.15_git-py2.7-macosx-10.9-intel.egg/sklearn/feature_extraction/text.py”，行1010，在變換X = normalize（X， norm = self.norm，copy = False）

文件“ /Library/Python/2.7/site-packages/scikit_learn-0.15_git-py2.7-macosx-10.9-intel.egg/sklearn/preprocessing/data.py”，第542行，規范化了inplace_csr_row_normalize_l2（X）

在sklearn.utils.sparsefuncs.inplace_csr_row_normalize_l2中的文件“ sparsefuncs.pyx”，第146行（sklearn / utils / sparsefuncs.c：2714）

ValueError：緩沖區dtype不匹配，應為'int'，但為'long'

供參考，代碼在這里： http : //scikit-learn.org/stable/auto_examples/document_clustering.html

我花了些時間來獲取整個scipy堆棧，但是我確定我現在擁有了，只是想知道為什么復制粘貼他們的代碼然后運行它會產生錯誤（我確定他們不會放代碼）和他們網站上的錯誤）。 對修復程序/正在發生的事情有任何想法嗎？

2 個解決方案

您是如何安裝scipy堆棧的？ 我強烈建議您不要自己組裝堆棧，因為這樣做非常具有挑戰性。 我更希望您使用anaconda https://store.continuum.io/cshop/anaconda/ 。

免責聲明：1）我不工作這些家伙。 2）anaconda具有免費版本。 很好。

一種有用的方法是安裝Anaconda和PyCharm或Eclipse IDE。 將您的解釋器從IDE指向Anaconda lib。 請參閱此鏈接以獲取更多指南： http : //docs.continuum.io/anaconda/ide_integration.html 。 另外，從外殼程序通過“ conda update”和“ anaconda update”更新包括scikit在內的pkg非常容易。

Scikit學習kmeans聚類

[英]Scikit-learn kmeans clustering

理解scikit-learn KMeans返回的“得分”

[英]Understanding “score” returned by scikit-learn KMeans

用於scikit-learn kmeans聚類的初始質心

[英]initial centroids for scikit-learn kmeans clustering

使用 GridSearchCV scikit-learn 進行管道中的 KMeans

[英]KMeans in pipeline with GridSearchCV scikit-learn

scikit-learn 中 kmeans 的自定義標准

[英]Custom criteria for kmeans in scikit-learn

scikit-learn中的kmeans的python內存錯誤

[英]python memory error for kmeans in scikit-learn

Scikit-學習教程文檔位置

[英]Scikit-learn tutorial documentation location

scikit-learn：查找有助於每個 KMeans 集群的特征

[英]scikit-learn: Finding the features that contribute to each KMeans cluster

如何從scikit-learn KMeans獲取集群中心的文本？

[英]How to get the text of cluster centers from scikit-learn KMeans?

在Python中使用scikit-learn kmeans對文本文檔進行聚類

[英]Clustering text documents using scikit-learn kmeans in Python

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Scikit學習kmeans聚類理解scikit-learn KMeans返回的“得分” 用於scikit-learn kmeans聚類的初始質心使用 GridSearchCV scikit-learn 進行管道中的 KMeans scikit-learn 中 kmeans 的自定義標准 scikit-learn中的kmeans的python內存錯誤 Scikit-學習教程文檔位置 scikit-learn：查找有助於每個 KMeans 集群的特征如何從scikit-learn KMeans獲取集群中心的文本？在Python中使用scikit-learn kmeans對文本文檔進行聚類

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM