[英]Automated journalism
一个名为StatSheet的网络软件今天获得资助(2010年8月4日)
他们正在进行“自动化新闻报道” - 利用计算机从统计数据中生成体育游戏的人性化报告
http://www.guardian.co.uk/media/pda/2010/mar/30/digital-media-algorithms-reporting-journalism
有没有人知道正在使用什么方法/算法来执行此操作/如何复制它?
像这样的项目的细节有点稀疏,但它看起来像棒球摘要统计猴子包括:
统计模型 :他们建立了一个关于棒球比赛通常如何展开的模型,最有可能通过观察某些变量(例如跑步,击球等)在比赛过程中如何变化或者与您期望看到的变化不同进入游戏(例如,一个无名团队比一个备受青睐的团队得分更多)。 给定游戏适合(或不适合)该模型的程度如何让他们了解该游戏可能有趣的内容(例如关键游戏或玩家)。
文本生成 :给定一个预先编写的叙事弧库(例如来回游戏,后来胜利等),他们使用游戏模型中的“有趣信息”来构建游戏。 我不确定,但看起来他们使用决策树 - 以模型中的信息为条件 - 选择其中一个弧。
杂项胶水 :这在他们的文章中没有提到,但在那里我会想到有相当数量的硬编码规则将主要的叙事弧“粘合”成一个单一的,有凝聚力的故事。
Stats Monkey的作者在相关领域进行了大量研究,如网站摘要和自动内容聚合和生成。 以下是一些可能有趣的论文:
Nathan Nichols和Kristian Hammond。 “机器生成的多媒体内容。” 第二届计算机人机交互进展国际会议论文集,2009年。
Nathan Nichols,Lisa Gandy和Kristian Hammond。 “ 从生成到挖掘:使用现有在线资源自动编写对话。 ” 第三届国际网络日志和社交媒体会议论文集,2009年。
J. Liu和L. Birnbaum。 2008. “LocalSavvy:聚合关于新闻问题的本地观点” 。 WWW 2008网上定位研讨会。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.