繁体   English   中英

按主题LDA添加单词

[英]Add words per topic LDA

我正在使用Gensim在python中构建LDA,而且我正努力将每个主题的印刷字数从默认值10增加。我希望20个主题,每个主题含30个字。 任何建议将不胜感激 :)

# train the LDA model

lda_model = gensim.models.LdaMulticore(bow_corpus, num_topics=20, id2word=dictionary, passes=2, workers=2)

# check out the topics

for idx, topic in lda_model.print_topics(-1):
   print('Topic: {} \nWords: {}'.format(idx, topic))

您有两个选择: show_topicsprint_topics

gensim ldamulticore文档中

show_topics (为print_topics提供更多可定制的别名,在您的情况下提供更漂亮的输出)具有参数num_words您要显示的单词数,按重要性排序。

for idx, topic in lda_model.show_topics(idx, num_words=30):
   print('Topic: {} \nWords: {}'.format(idx, topic))

您也可以省略idx输出不受它的影响。 print_topics工作原理类似,但默认显示10个主题:

for idx, topic in lda_model2.show_topics(num_topics=20, num_words=30):
   print('Topic: {} \nWords: {}'.format(idx, topic))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM