繁体   English   中英

短文主题建模 Python

[英]Topic modeling on short texts Python

我想对短文本进行主题建模。 我对 LDA 进行了一些研究,发现它不能很好地处理短文本。 什么方法会更好,他们有 Python 实现吗?

您可以尝试短文本主题建模(请参阅此https://www.groundai.com/project/sttm-a-tool-for-short-text-topic-modeling/1 )(代码可在https://github .com/qiang2100/STTM )。 它结合了最先进的算法和传统的长文本主题建模,可以方便地用于短文本。

对于更专业的库,请尝试 lda2vec-tf,它结合了词向量和 LDA 主题向量。 它是从原始的 lda2vec 分支出来的,并在基础上进行了改进,并提供了比原始库更好的结果。

短文本主题建模的唯一 Python 实现是GSDMM 不幸的是,其他大多数都写在 Java 上。

除了GSDM之外, python中还实现了用于短文本主题建模的 biterm。

这是一个非常快速且易于使用的 GSDMM 实现,可用于 Python: https://github.com/centre-for-humanities-computing/tweetopic

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM