簡體   English   中英

BerTopic Model - 可視化忽略第 0 個索引

[英]BerTopic Model - Visualization ignores 0th index

BerTopic model 產生了以下主題:

在此處輸入圖像描述

從上面可以看出,model 被微調以生成較小的異常值“-1”,其計數為 3,並出現在最后。

根據 class 可視化主題時

topic_model.visualize_topics_per_class(topics_per_class)

生成了以下交互式視覺效果,但是它忽略了0th個索引,准確地說是主題 0。全局主題表示從1, 2, 3, 4, 5, 6, -1顯示

在此處輸入圖像描述

BerTopic 的設計方式是否總是假設第一個索引將是異常值 ( -1 ),並盲目地消除它?

生成的主題是否總是根據計數大小訪問,可能是按降序排列的?

這個問題也發布在BerTopic github論壇,以及作者本人的回復,

在此處輸入圖像描述

通過設置top_n_topics=None ,可以在可視化的同時查看所有主題以及0th個索引,

topic_model.visualize_topics_per_class(topics_per_class, top_n_topics=None)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM