繁体   English   中英

词频对Gensim LDA Topic建模有什么影响

[英]What is the impact of word frequency on Gensim LDA Topic modelling

我正在尝试将 Gensim LDA 建模用于食品食谱数据集的主题模型。 我希望有基于食谱中关键成分的主题。 但是配方文本包含更多通用英语而不是成分名称的单词。 因此,我的主题结果没有预期的那么好。 我试图了解词频在 LDA 主题结果中的影响。 谢谢。

您是否尝试从构建 LDA 模型的数据中删除停用词

另外,请记住,实际上不可能影响主题之间的单词分配。 这已经在这个问题的答案中讨论过: 如何改进 lda 中不同主题中的词分配

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM