繁体   English   中英

自动化新闻

[英]Automated journalism

一个名为StatSheet的网络软件今天获得资助(2010年8月4日)

http://techcrunch.com/2010/08/04/former-crunchies-finalist-statsheet-recieves-1-3-million-in-series-a/

他们正在进行“自动化新闻报道” - 利用计算机从统计数据中生成体育游戏的人性化报告

http://www.guardian.co.uk/media/pda/2010/mar/30/digital-media-algorithms-reporting-journalism

有没有人知道正在使用什么方法/算法来执行此操作/如何复制它?

像这样的项目的细节有点稀疏,但它看起来像棒球摘要统计猴子包括:

  1. 统计模型 :他们建立了一个关于棒球比赛通常如何展开的模型,最有可能通过观察某些变量(例如跑步,击球等)在比赛过程中如何变化或者与您期望看到的变化不同进入游戏(例如,一个无名团队比一个备受青睐的团队得分更多)。 给定游戏适合(或不适合)该模型的程度如何让他们了解该游戏可能有趣的内容(例如关键游戏或玩家)。

  2. 文本生成 :给定一个预先编写的叙事弧库(例如来回游戏,后来胜利等),他们使用游戏模型中的“有趣信息”来构建游戏。 我不确定,但看起来他们使用决策树 - 以模型中的信息为条件 - 选择其中一个弧。

  3. 杂项胶水 :这在他们的文章中没有提到,但在那里我会想到有相当数量的硬编码规则将主要的叙事弧“粘合”成一个单一的,有凝聚力的故事。

Stats Monkey的作者在相关领域进行了大量研究,如网站摘要和自动内容聚合和生成。 以下是一些可能有趣的论文:

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM