作者:明宇,来源:TechWeb(ID:TechWeb)
【TechWeb报道】8月12日消息,奥运会开幕后,众多用户都通过新闻客户端第一时间了解比赛的赛况。比如,你可能看到了这样一条有关乒乓球女单比赛的新闻:
“丁宁本轮的对手是现世界排名第7的韩英,实力不俗。但经过4场大战的激烈较量,最终,丁宁还是以总比分4:0战胜对手,笑到了最后,为中国延续了在这个系列赛事中最终夺冠的机会。”
值得注意的是,这条超过5.4万阅读量的新闻并不是出自记者、编辑之手,而是由机器人写成。这个机器人名叫“张小明”,由今日头条实验室推出,其“写稿”模块是由头条实验室与北京大学计算所(万小军团队)联合研发而成。
它可以通过两种文本生成技术产出新闻:
1)针对数据库中表格数据和知识库生成自然语言的比赛结果报道,即简讯;
2)利用体育比赛文字直播精炼合成比赛过程的总结报道,即资讯。
据了解,张小明主要报道乒乓球、网球、羽毛球和女足的比赛,以2秒种的生成时间,发布着每一场赛事的新闻稿,6天共生成超200篇简讯和资讯。
此前,国内也有了一些机器人写稿的尝试,张小明的写稿技术已经进入是第二代写稿水平。与第一代机器人相比 ,张小明特征包括:速度快、样式多、自适应、自动配图等。
今日头条相关人士对TechWeb表示,张小明最大的意义在于,面对奥运会这样同时举行上百场比赛的综合赛事,记者很难关注到每一场比赛,而机器人可以任劳任怨的为每一场比赛报道,无论这场比赛多么冷门和不重要。
“传统新闻理论并不认为这些冷门比赛或者热门比赛(比如乒乓球)的前几轮小组赛有新闻价值,可是通过我们的平台测试,我们发现对冷门场次的报道任然有可观的阅读量,这个阅读量非常长尾,而新闻机器人可以弥补对这种长尾的新闻需求。”
………………………………………………