繁体   English   中英

如何创建附加主题建模可视化?

[英]How to create attached topic modeling visualization?

我在https://www.kdnuggets.com/2018/08/topic-modeling-lsa-plsa-lda-lda2vec.html找到了附加的图片。 它显示了主题建模结果的可视化。 使用哪种工具来创建这样的可视化? 有关如何创建它的任何指导?

主题建模可视化

他们从经过训练的主题模型中提取了一些信息,并将其重塑为图形(网络)形式。 看起来他们已经将模型中每个主题中关联性最强的词作为图中的一组节点,还为每个单独的主题添加了一个节点,并根据他们认为的主题自行给它一个标签关于。

我的猜测是术语节点和主题节点之间的边(连接)由模型开发的术语到主题得分加权。 他们可能已经过滤掉了低分,这就是为什么术语和一两个主题之间只有边缘(而在主题建模中,每个术语都有一些与每个主题相关的分数)。

为了可视化图形,看起来他们使用了 Gephi,这是一个开源图形可视化工具。 他们可能使用了 force atlas 2 布局来分布节点,通过模块化类(可以在 gephi 中计算)为节点着色,并手动将主题节点的大小设置为大于术语节点。

就实际生成这样的东西而言,可以使用 networkx 包来创建图形表示。 有很多关于如何使用 networkx 的教程。

创建包含我上面描述的结构的 networkx 图形对象后,您可以将其导出为.gexf格式, .gexf可以打开该格式,以便您进行可视化的最后阶段。 同样,应该可以使用在线教程在 Gephi 中执行这些操作。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM