繁体 English 中英

从 Gensim LDA 或 pyLDAvis 中提取词显着性

[英]Extract Word Saliency from Gensim LDA or pyLDAvis

原文 2021-10-15 01:46:19 7 1 gensim/ lda/ topic-modeling/ pyldavis

我看到 pyLDAvis 可视化了每个主题下每个单词的显着性。

但是我们有没有办法提取每个主题下每个单词的显着性？ 或者如何直接使用Gensim LDA计算每个单词的显着性？

所以最后，我想得到一个 Pandas 数据框，一行代表一个词，每一列代表每个主题，它的值代表相应主题下词的显着性。

提前谢谢了。

1 个解决方案

Gensim 的 LDA 支持对 Chuang 等人 (2012) 的这种特殊“显着性”计算没有开箱即用的支持。

不过，我怀疑模型的.get_term_topics()和/或.get_topic_terms()方法是实现该计算的正确支持数据。 特别是，这些方法中的一种或另一种可能提供p( w | t )项，但需要更深入地阅读论文才能确定。 （我怀疑P(t)项可能需要对训练数据进行单独调查。）

来自课堂文档：

https://radimrehurek.com/gensim/models/ldamodel.html#gensim.models.ldamodel.LdaModel.get_term_topics

返回相关主题表示为它们的 ID 和它们分配的概率的对，按与给定单词的相关性排序。

https://radimrehurek.com/gensim/models/ldamodel.html#gensim.models.ldamodel.LdaModel.get_topic_terms

返回词 ID - 主题生成的最相关词的概率对。

我之前没有遇到过这种特殊的“显着性”计算，但是如果它在 LDA 用户中很受欢迎，或者具有潜在的普遍用途，并且您知道如何计算它，那么它可能是对 Gensim 项目的一个受欢迎的贡献- 特别是如果它可以是LdaModel上一个简单的额外方便的方法。

可以从gensim lda模型中提取弓

[英]is possible to extract bow from gensim lda model

有没有办法将Gensim LDA输出与pyLDAvis图中的主题相匹配？

[英]Is there any way to match Gensim LDA output with topics in pyLDAvis graph?

如何通过gensim在LDA分析中删除单词

[英]How to remove a word in LDA analysis by gensim

提取文档 LDA Gensim Python 的主题分数

[英]Extract Topic Scores for Documents LDA Gensim Python

来自gensim的pyLDAvis可视化未在google colab中显示结果

[英]pyLDAvis visualization from gensim not displaying the result in google colab

从lda gensim检索topic-word数组和document-topic数组

[英]retrieve topic-word array & document-topic array from lda gensim

LDA Gensim Word - >主题ID分布而不是主题 - >单词分发

[英]LDA Gensim Word -> Topic Ids Distribution instead of Topic -> Word Distribution

词频对Gensim LDA Topic建模有什么影响

[英]What is the impact of word frequency on Gensim LDA Topic modelling

如何在gensim LDA中获取给定单词的主题词概率？

[英]How to get the topic-word probabilities of a given word in gensim LDA?

从gensim LDA模型中提取Topic分布

[英]Extracting Topic distribution from gensim LDA model

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 可以从gensim lda模型中提取弓有没有办法将Gensim LDA输出与pyLDAvis图中的主题相匹配？如何通过gensim在LDA分析中删除单词提取文档 LDA Gensim Python 的主题分数来自gensim的pyLDAvis可视化未在google colab中显示结果从lda gensim检索topic-word数组和document-topic数组 LDA Gensim Word - >主题ID分布而不是主题 - >单词分发词频对Gensim LDA Topic建模有什么影响如何在gensim LDA中获取给定单词的主题词概率？从gensim LDA模型中提取Topic分布

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM