繁体   English   中英

BerTopic Model - 可视化忽略第 0 个索引

[英]BerTopic Model - Visualization ignores 0th index

BerTopic model 产生了以下主题:

在此处输入图像描述

从上面可以看出,model 被微调以生成较小的异常值“-1”,其计数为 3,并出现在最后。

根据 class 可视化主题时

topic_model.visualize_topics_per_class(topics_per_class)

生成了以下交互式视觉效果,但是它忽略了0th个索引,准确地说是主题 0。全局主题表示从1, 2, 3, 4, 5, 6, -1显示

在此处输入图像描述

BerTopic 的设计方式是否总是假设第一个索引将是异常值 ( -1 ),并盲目地消除它?

生成的主题是否总是根据计数大小访问,可能是按降序排列的?

这个问题也发布在BerTopic github论坛,以及作者本人的回复,

在此处输入图像描述

通过设置top_n_topics=None ,可以在可视化的同时查看所有主题以及0th个索引,

topic_model.visualize_topics_per_class(topics_per_class, top_n_topics=None)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM