繁体   English   中英

如何使用具有数值特征的 TF-IDF 向量(稀疏矩阵)?

[英]How to use TF-IDF vector (sparse matrix) with numerical features?

我发现这个问题提到在 tf-idf 稀疏矩阵上使用 toarray() ,然后从中制作 dataframe 并与其他 dataframe 连接。

但是,使用 Google Colab 时 session 会崩溃(我相信 memory 问题)。 有解决方法吗?

我想使用来自 LIWC(语言查询字数)类别以及 TF-IDF 的数字特征来使用逻辑回归构建分类 model。

抱歉,如果这个问题的格式不正确,这是我的第一个问题。

你用的是什么package? 如果您使用的是scikit-learn ,听起来您正在寻找FeatureUnion - 该页面上有一个示例。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM