簡體 English 中英

有沒有辦法將nltk功能集轉換為scipy.sparse數組？

[英]Is there a way to convert nltk featuresets into a scipy.sparse array?

原文 2011-12-06 01:32:52 0 2 python/ nlp/ nltk/ scikits

我正在嘗試使用scikit.learn，它需要numpy / scipy數組作為輸入。 在nltk中生成的特征集由單音和雙字頻率組成。 我可以手動完成，但是會很費力。 因此，想知道是否有我忽略的解決方案。

2 個解決方案

雅各布·珀金斯（Jacob Perkins）為使用scikit-learn分類器訓練NLTK分類器搭建了一座橋梁，這正是源於此：

https://github.com/japerk/nltk-trainer/blob/master/nltk_trainer/classification/sci.py

如果您使用的是0.9+版本，則應更新軟件包導入行。

並不是我所知道的，但是請注意scikit-learn本身可以進行n克頻率計數。 假設單詞級n -grams：

from sklearn.feature_extraction.text import CountVectorizer, WordNGramAnalyzer
v = CountVectorizer(analyzer=WordNGramAnalyzer(min_n=1, max_n=2))
X = v.fit_transform(files)

其中files是字符串或類似文件的對象的列表。 在此之后， X是原始頻率計數的稀疏矩陣。

是否有連接scipy.sparse矩陣的有效方法？

[英]Is there an efficient way of concatenating scipy.sparse matrices?

用scipy.sparse計數

[英]Counting with scipy.sparse

如何在python中將稀疏字典轉換為scipy.sparse矩陣？

[英]How to convert a sparse dict to scipy.sparse matrix in python?

有沒有辦法對 scipy.sparse 矩陣進行快速 boolean 操作？

[英]Is there a way to have fast boolean operations on scipy.sparse matrices?

計算 scipy.sparse 矩陣的偽逆的列子集的最快方法

[英]Fastest way to compute a subset of columns of the pseudoinverse of a scipy.sparse matrix

切片scipy.sparse矩陣的最快方法是什么？

[英]What is the fastest way to slice a scipy.sparse matrix?

Scipy。稀疏乘法錯誤

[英]Scipy.sparse multiplication error

scipy.sparse 默認值

[英]scipy.sparse default value

沒有scipy.sparse的矢量化稀疏和

[英]Vectorize sparse sum without scipy.sparse

將scipy.sparse（）稀疏矩陣輸入CVXOPT

[英]Feeding scipy.sparse() sparse matrices into CVXOPT

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 是否有連接scipy.sparse矩陣的有效方法？用scipy.sparse計數如何在python中將稀疏字典轉換為scipy.sparse矩陣？有沒有辦法對 scipy.sparse 矩陣進行快速 boolean 操作？計算 scipy.sparse 矩陣的偽逆的列子集的最快方法切片scipy.sparse矩陣的最快方法是什么？ Scipy。稀疏乘法錯誤 scipy.sparse 默認值沒有scipy.sparse的矢量化稀疏和將scipy.sparse（）稀疏矩陣輸入CVXOPT

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM