繁体 English 中英

自动化新闻

[英]Automated journalism

原文 2010-08-05 13:38:50 4 1 artificial-intelligence/ machine-learning

一个名为StatSheet的网络软件今天获得资助（2010年8月4日）

他们正在进行“自动化新闻报道” - 利用计算机从统计数据中生成体育游戏的人性化报告

有没有人知道正在使用什么方法/算法来执行此操作/如何复制它？

像这样的项目的细节有点稀疏，但它看起来像棒球摘要统计猴子包括：

统计模型 ：他们建立了一个关于棒球比赛通常如何展开的模型，最有可能通过观察某些变量（例如跑步，击球等）在比赛过程中如何变化或者与您期望看到的变化不同进入游戏（例如，一个无名团队比一个备受青睐的团队得分更多）。 给定游戏适合（或不适合）该模型的程度如何让他们了解该游戏可能有趣的内容（例如关键游戏或玩家）。
文本生成 ：给定一个预先编写的叙事弧库（例如来回游戏，后来胜利等），他们使用游戏模型中的“有趣信息”来构建游戏。 我不确定，但看起来他们使用决策树 - 以模型中的信息为条件 - 选择其中一个弧。
杂项胶水 ：这在他们的文章中没有提到，但在那里我会想到有相当数量的硬编码规则将主要的叙事弧“粘合”成一个单一的，有凝聚力的故事。

Stats Monkey的作者在相关领域进行了大量研究，如网站摘要和自动内容聚合和生成。 以下是一些可能有趣的论文：

Nathan Nichols和Kristian Hammond。 “机器生成的多媒体内容。” 第二届计算机人机交互进展国际会议论文集，2009年。
Nathan Nichols，Lisa Gandy和Kristian Hammond。 “ 从生成到挖掘：使用现有在线资源自动编写对话。 ” 第三届国际网络日志和社交媒体会议论文集，2009年。
J. Liu和L. Birnbaum。 2008. “LocalSavvy：聚合关于新闻问题的本地观点” 。 WWW 2008网上定位研讨会。