繁体   English   中英

推文的语义分析

[英]Semantic analysis of tweets

我知道如何与Twitter通信以及如何检索推文,但我正在寻找有关这些推文的进一步工作。

我有两类食物和运动。 现在,我想将推文归类为美食和体育。 谁能建议我如何基于计算机算法进行分类?

问候高拉夫

我最近一直在与潜在Dirichlet分配一起做一些工作。 一般的想法是文档包含从主题生成的单词。 您可以尝试做的是加载已知与您感兴趣的主题有关的文档的语料库,使用感兴趣的推文进行更新,然后选择与您的已知文档具有相同主题的概率很高的推文。

我将R用于LDA(package:topicmodels和package:lda),但我认为也有一些预构建的python工具。 除非您在贝叶斯统计方面有扎实的基础,否则我可能会避免尝试编写自己的书。

以下是topicmodels软件包的文档: http ://cran.r-project.org/web/packages/topicmodels/vignettes/topicmodels.pdf

我怀疑一套算法是否可能对开放域中的推文进行分类。 换句话说,我认为没有一套规则可以对开放域推文进行分类。 您需要将推文解析为针对分类定制的语义表示。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM