簡體   English   中英

分數在主題建模中表示什么

[英]What does the score indicate in topic modelling

我按照本教程https://www.datacamp.com/community/tutorials/discovering-hidden-topics-python將 gimsm 用於 LSA

在運行它以獲取文本列表后,我得到了以下 output


[(1, '-0.708*"London" + 0.296*"like" + 0.294*"go" + 0.287*"dislike" + 0.268*"great" + 0.200*"romantic" + 0.174*"stress" + 0.099*"lovely" + 0.082*"good" + -0.075*"Tower" + 0.072*"see" + 0.063*"nice" + 0.061*"amazing" + -0.053*"Palace" + 0.053*"walk" + -0.050*"Eye" + 0.046*"eat" + -0.042*"Bridge" + 0.041*"Garden" + 0.040*"Covent" + -0.040*"old" + -0.039*"visit" + 0.039*"really" + 0.035*"spend" + 0.034*"watch" + 0.034*"get" + -0.032*"Buckingham" + 0.032*"Weather" + -0.032*"Museum" + -0.032*"Westminster"')]

-0.708 倫敦表示什么?

這些是對你的主題最有貢獻的詞,無論是積極的還是消極的。 您的主題的特征之一似乎是,它與倫敦沒有任何關系。 您可以看到其他“與倫敦相關的”詞也對您的主題產生負面影響:威斯敏斯特、塔和眼睛對該主題也有負面影響。

因此,根據您的 model 的說法,如果文本缺少 London 一詞,那么該文本很可能與該主題有關。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM