簡體   English   中英

短文主題建模 Python

[英]Topic modeling on short texts Python

我想對短文本進行主題建模。 我對 LDA 進行了一些研究,發現它不能很好地處理短文本。 什么方法會更好,他們有 Python 實現嗎?

您可以嘗試短文本主題建模(請參閱此https://www.groundai.com/project/sttm-a-tool-for-short-text-topic-modeling/1 )(代碼可在https://github .com/qiang2100/STTM )。 它結合了最先進的算法和傳統的長文本主題建模,可以方便地用於短文本。

對於更專業的庫,請嘗試 lda2vec-tf,它結合了詞向量和 LDA 主題向量。 它是從原始的 lda2vec 分支出來的,並在基礎上進行了改進,並提供了比原始庫更好的結果。

短文本主題建模的唯一 Python 實現是GSDMM 不幸的是,其他大多數都寫在 Java 上。

除了GSDM之外, python中還實現了用於短文本主題建模的 biterm。

這是一個非常快速且易於使用的 GSDMM 實現,可用於 Python: https://github.com/centre-for-humanities-computing/tweetopic

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM