[英]Add words per topic LDA
我正在使用Gensim在python中构建LDA,而且我正努力将每个主题的印刷字数从默认值10增加。我希望20个主题,每个主题含30个字。 任何建议将不胜感激 :)
# train the LDA model
lda_model = gensim.models.LdaMulticore(bow_corpus, num_topics=20, id2word=dictionary, passes=2, workers=2)
# check out the topics
for idx, topic in lda_model.print_topics(-1):
print('Topic: {} \nWords: {}'.format(idx, topic))
您有两个选择: show_topics
和print_topics
。
show_topics
(为print_topics
提供更多可定制的别名,在您的情况下提供更漂亮的输出)具有参数num_words
您要显示的单词数,按重要性排序。
for idx, topic in lda_model.show_topics(idx, num_words=30):
print('Topic: {} \nWords: {}'.format(idx, topic))
您也可以省略idx
输出不受它的影响。 print_topics
工作原理类似,但默认显示10个主题:
for idx, topic in lda_model2.show_topics(num_topics=20, num_words=30):
print('Topic: {} \nWords: {}'.format(idx, topic))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.