簡體   English   中英

如何更改LDA中的默認number_words

[英]how to change default number_words in LDA

我能夠使用gensim從LDA模型中提取主題。 當我打印主題時,默認情況下顯示的主題數為10個字。 我想在一個topic中顯示15個單詞。我試圖更改它,但每個主題我仍然得到10個單詞。如何更改此默認行為?

這是代碼:

for n, topic in model.show_topics(num_topics=-1, num_words=15,formatted=False):
                topic = [word for word, _ in topic]
                cm = CoherenceModel(topics=[topic], texts=documents, dictionary=dictionary, window_size=10)
                coherence_values[n] = cm.get_coherence()
            top_topics = sorted(coherence_values.items(), key=operator.itemgetter(1), reverse=True)
            result.append((model, top_topics))

和打印主題:

pprint([lm.show_topic(topicid) for topicid, c_v in top_topics[:8]])

我認為問題出在show_topic函數中。 您正在為該主題找到更多單詞,但沒有顯示它們,因為show_topic有一個可選變量,topn用於檢索最重要的單詞。 默認值為10,因此將print語句中的代碼更改為

pprint([lm.show_topic(topicid, topn=15) for topicid, c_v in top_topics[:8]])

並且應該全部顯示。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM