簡體   English   中英

kmeans scikit學習教程

[英]kmeans scikit-learn tutorial

我正在嘗試使用Python而不是R進行數據分析,並且遇到了一些麻煩。 因此,我一直在閱讀scikit-learn的文檔,並嘗試自己運行kmeans示例,但收到以下錯誤消息:

使用稀疏矢量化器Traceback(最近一次通話最后一次)從訓練數據集中提取特征:

X = vectorizer.fit_transform(dataset.data)中的文件“ kmeans.py”,第104行

文件“ /Library/Python/2.7/site-packages/scikit_learn-0.15_git-py2.7-macosx-10.9-intel.egg/sklearn/feature_extraction/text.py”,行1238,在fit_transform中返回self._tfidf.transform (X,copy = False)

文件“ /Library/Python/2.7/site-packages/scikit_learn-0.15_git-py2.7-macosx-10.9-intel.egg/sklearn/feature_extraction/text.py”,行1010,在變換X = normalize(X, norm = self.norm,copy = False)

文件“ /Library/Python/2.7/site-packages/scikit_learn-0.15_git-py2.7-macosx-10.9-intel.egg/sklearn/preprocessing/data.py”,第542行,規范化了inplace_csr_row_normalize_l2(X)

在sklearn.utils.sparsefuncs.inplace_csr_row_normalize_l2中的文件“ sparsefuncs.pyx”,第146行(sklearn / utils / sparsefuncs.c:2714)

ValueError:緩沖區dtype不匹配,應為'int',但為'long'

供參考,代碼在這里: http : //scikit-learn.org/stable/auto_examples/document_clustering.html

我花了些時間來獲取整個scipy堆棧,但是我確定我現在擁有了,只是想知道為什么復制粘貼他們的代碼然后運行它會產生錯誤(我確定他們不會放代碼)和他們網站上的錯誤)。 對修復程序/正在發生的事情有任何想法嗎?

您是如何安裝scipy堆棧的? 我強烈建議您不要自己組裝堆棧,因為這樣做非常具有挑戰性。 我更希望您使用anaconda https://store.continuum.io/cshop/anaconda/

免責聲明:1)我不工作這些家伙。 2)anaconda具有免費版本。 很好。

一種有用的方法是安裝Anaconda和PyCharm或Eclipse IDE。 將您的解釋器從IDE指向Anaconda lib。 請參閱此鏈接以獲取更多指南: http : //docs.continuum.io/anaconda/ide_integration.html 另外,從外殼程序通過“ conda update”和“ anaconda update”更新包括scikit在內的pkg非常容易。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM