簡體 English 中英

如何使用csr_matrix初始化gensim語料庫變量？

[英]How do you initialize a gensim corpus variable with a csr_matrix?

原文 2013-03-27 22:12:52 2 1 python/ scikit-learn/ document-classification/ lda/ gensim

我有X作為csr_matrix，我使用scikit的tfidf矢量化器獲得，y是一個數組

我的計划是使用LDA創建功能，但是，我沒有找到如何使用X作為csr_matrix初始化gensim的語料庫變量。 換句話說，我不想下載gensim文檔中顯示的語料庫，也不想將X轉換為密集矩陣，因為它會消耗大量內存並且計算機可能會掛起。

簡而言之，我的問題如下，

如果我有一個代表整個語料庫的csr_matrix（稀疏），你如何初始化gensim語料庫？
你如何使用LDA提取功能？

1 個解決方案

Gensim有一個半隱藏的功能，可以為你做這件事：

http://radimrehurek.com/gensim/matutils.html#gensim.matutils.Sparse2Corpus

“class gensim.matutils.Sparse2Corpus（sparse，documents_columns = True）將scipy.sparse格式的矩陣轉換為流式gensim語料庫。”

我使用用CountVectorizer提取的語料庫，然后加載到gensim中，我取得了一些成功。

如何獲得csr_matrix中列的mean和std？

[英]How do you get the mean and std of a column in a csr_matrix?

如何更新csr_matrix中的值

[英]how to update value in csr_matrix

如何將兩個csr_matrix合並為一個？

[英]How to merge two csr_matrix into one?

如何在scipy中創建評級csr_matrix？

[英]How to create a ratings csr_matrix in scipy?

（Python Scipy）如何展平一個csr_matrix並將其附加到另一個csr_matrix？

[英](Python Scipy) How to flatten a csr_matrix and append it to another csr_matrix?

如何保留 SciPy 稀疏矩陣 CSR_Matrix 中的插入順序？

[英]How to preserve order of insertion in SciPy Sparse Matrix CSR_Matrix?

設置csr_matrix行

[英]Set row of csr_matrix

csr_matrix indptr的用途？

[英]csr_matrix indptr purpose?

在python中如何替換稀疏csr_matrix中的nan

[英]In python how to replace nan in sparse csr_matrix

如何將列中包含字符串的數據幀轉換為csr_matrix

[英]How to convert a dataframe with string in columns into csr_matrix

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何獲得csr_matrix中列的mean和std？如何更新csr_matrix中的值如何將兩個csr_matrix合並為一個？如何在scipy中創建評級csr_matrix？（Python Scipy）如何展平一個csr_matrix並將其附加到另一個csr_matrix？如何保留 SciPy 稀疏矩陣 CSR_Matrix 中的插入順序？設置csr_matrix行 csr_matrix indptr的用途？在python中如何替換稀疏csr_matrix中的nan 如何將列中包含字符串的數據幀轉換為csr_matrix

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM