[英]Extract Word Saliency from Gensim LDA or pyLDAvis
Gensim 的 LDA 支持對 Chuang 等人 (2012) 的這種特殊“顯着性”計算沒有開箱即用的支持。
不過,我懷疑模型的.get_term_topics()
和/或.get_topic_terms()
方法是實現該計算的正確支持數據。 特別是,這些方法中的一種或另一種可能提供p( w | t )
項,但需要更深入地閱讀論文才能確定。 (我懷疑P(t)
項可能需要對訓練數據進行單獨調查。)
來自課堂文檔:
https://radimrehurek.com/gensim/models/ldamodel.html#gensim.models.ldamodel.LdaModel.get_term_topics
返回相關主題表示為它們的 ID 和它們分配的概率的對,按與給定單詞的相關性排序。
https://radimrehurek.com/gensim/models/ldamodel.html#gensim.models.ldamodel.LdaModel.get_topic_terms
返回詞 ID - 主題生成的最相關詞的概率對。
我之前沒有遇到過這種特殊的“顯着性”計算,但是如果它在 LDA 用戶中很受歡迎,或者具有潛在的普遍用途,並且您知道如何計算它,那么它可能是對 Gensim 項目的一個受歡迎的貢獻- 特別是如果它可以是LdaModel
上一個簡單的額外方便的方法。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.