专栏名称: 大数据文摘

普及数据思维，传播数据文化

NYU教授给写AI新闻的记者们写了一封推心置腹的信，你也应该读读

大数据文摘 · 公众号 · 大数据 · 2017-07-25 11:59

正文

大数据文摘作品，转载要求见文末

编译 | Keiko , Aileen

导读：AI新闻正在迅速占领各大门户网站和微信公众号的头条，一大批AI跑口记者也相应涌现，良莠不齐。

NYU教授Julian Togelius针对这个崭新的新闻领域，在自己的博客上发表了一篇文章，提出了给记者们在写有关人工智能文章时的建议。

这篇文章出现后，包括Yann Lecun在内的业界专家纷纷点赞转发，大概真的是说出了他们的心里话吧。而除了AI记者，这篇文章中提到的事实和建议，大概需要每一个关心人工智能的人仔细读读。

（作者：不，我不是个脾气糟糕的怪老头）

亲爱的记者朋友们，

近期常能读到不少人工智能相关的“烂文”（新闻和公关稿都有），故想针对如何写成更好更真实的人工智能新闻为各位稍提建议。有些文章基本上是废话，有些错误满篇，有的看起来好像很靠谱但也充满着误导。我不会指名道姓，任何在AI领域工作或者经常读AI新闻的人都会有大把的例子。当然，也有很多很棒很好的文章，不过好文章的比例还有待提高。

首先，我理解，你所写的是一个在急速变化的领域，其中充满了各种各样的专业术语和有伟大远景的专业人士。除了这些令人兴奋的事物外，这个领域中还有大量值得一写的内容，但是你其实并不太了解或者说完全不了解这个领域。

你对人工智能的了解可能和我对“皮革制造”的了解一样少。

但是，皮革制造的发展过程非常缓慢，涉及具体的原材料和机器设备。人工智能却发展的非常迅速，并且涉及的相关内容都是你无法触碰或者看到的。你会产生一种必须在新闻过时前立刻写出最新进展的焦虑，但是你却不知道从哪里开始入手，解密那些人工智能研究者的古怪言论。你当然想写出能够被大众阅读认同和点击率高的文章，但是你又没有太多时间，所以这不是一个轻松的活儿。

所以为了对人工智能领域有更高质量的报道，并且基于我对不同技术实力记者写出的采访内容的满意程度，我将给出以下可靠建议。

人工智能是一个很大且分支很广的领域

事实：人工智能是一个很大的领域，从相关论题和使用的方法来看，是变化多样的。

人工智能领域的重大会议（比如 IJCAI,AAAI,ICML和 NIPS）有成千上万的与会者，其中的绝大多数人却只了解会议中的一小部分内容，当我去参加这些会议的时候，我只能听懂大概20%的内容并得到一些启发。虽然我本人可能不太聪明，但是能同时跟进人工智能多样的分支领域，比如约束传播，深度学习和随机搜索的前沿知识的人是非常稀少的。

建议：不要默认你采访的研究者了解“最近人工智能领域最前沿的是什么”。

更重要的是，如果有人说他们知道现在人工智能领域在发生着什么，请默认他们只了解这个大领域中的一小部分。所以请跟AI领域中的其他部分的研究者复核一下。

没有任何人工智能的系统是可以做多个任务的

事实：根本没有所谓的“一种人工智能技术”存在。

人工智能是开发模仿人类使用大脑去做一些事情的软件的方法和概念的合集。研究者和开发者开发出新的方法（也用已有的方法）去构建一些引人瞩目的软件（有时候是硬件），比如能玩游戏或者画猫咪。不过，同一个系统不能同时玩游戏和画猫咪。事实上，我没有听说过可以做很多个任务的人工智能系统。即使当同样的研究者基于同样的概念，为了完成不同的任务而开发系统时，他们会选择开发多个软件系统来实现。当有的记者写“X公司的人工智能技术不仅已经可以开车，现在还能写诗”的时候，这些记者模糊了其实有另外的系统实现了写诗的事实，给读者一种有特别智能的机器存在的错觉。事实并不是这样。

建议：不要说"一种人工智能技术”。

多去挖掘系统的限制性。去看看太空侵略者和蒙特苏马的复仇这两个游戏是不是应用了一样的神经网络模型（提示：并不是）。

人工智能不是什么新鲜事物。

事实：人工智能是一个旧领域，并且其中只有几个概念是真正的新概念。

时下很酷炫但是稍微有些被高估的深度学习的进展起源于上世纪八九十年代的神经网络研究，而神经网络模型更是基于上世纪四十年代的概念和实验。在很多情况下，前沿研究是由对已有方法的微小改动和改进组成，而这些已有方法在研究者还没出生的时候就已经被设计出来了。”反向传播“这个算法是现在深度学习的主要支撑，已经有好几十年的历史，并且是由多人独立发现的。IBM的深蓝计算机战胜了国际象棋大师盖瑞卡斯帕罗夫证明了电脑比人类更会下国际象棋，其中的核心算法是有阿兰· 图灵在1940年代就提出的极大极小值算法。图灵，人工智能和广义计算机科学的创始人之一，在1950年写了名为“计算机器与智能”的论文。这篇论文不仅因我们现在所称的图灵测试而闻名，也包含了人工智能的很多核心概念的萌芽。

建议：阅读图灵1950年的论文（http://www.loebner.net/Prizef/TuringArticle.html）。这是一篇阅读感非常棒的文章，没有复杂的数学公式，各种技术词汇也非常通俗的融入其中。

你会惊叹于人工智能的几个关键思想在当时已经到位，虽然可能只是萌芽阶段。在撰写关于令人兴奋的技术新突破的故事时，建议多咨询在这个行业已有些年纪的老人家，或至少是中年人的AI研究者。这些人在AI变得很酷之前就开始研究AI了，所以已经经历过了一个AI炒作的循环。有可能这个人可以告诉你这个新进展是从哪个旧想法稍微改进一点而来的。

不要相信炒作，多寻求客观意见。

事实：研究人员总是想卖点什么。

显然，那些在创业公司中工作的人正在寻求增加公司的估值和投资或收购的机会。在学术界工作的人正在寻找谈话邀请，文章引用，推广等。那些在大公司工作的人希望人们对他们的某些与实际研究结果有关（甚至无关）的产品感兴趣。

建议：不要相信炒作。

不要找撰写这篇文章的相关人员推荐给你的采访人，尝试寻找其他研究人员并寻求他们的意见，询问是否相信该文章里描述的主张。

人工智能多来自于人类的智慧，并不完全为自动化。

事实：大部分“人工智能”其实是人的智慧。

研究人员和开发人员专注于将AI应用于特定领域（如机器人，游戏或翻译）的原因是：构建系统来解决问题时，大量与实际问题相关的知识（“领域知识”）被包含在系统里。为了更简单的构架系统，可能需要为系统提供特别的输入，使用专门为其准备的训练数据，人工手动进行部分系统的编码，或甚至为了解决问题需要重新编写。

建议：理解“AI解决方案”的哪些部分是自动的，哪些是由于人类领域知识的手动编码而来。

一个好方法就是提问"如果在一个不同的问题上，这个系统将如何工作"。

我先写到这儿吧，这偏文章可能听起来有些暴躁。其实，我脾气不暴躁，我也一点都不老（我还是一个宝宝！）。而且我不想让人觉得AI并没有什么进步值得报道的。

事实上，已经有很多很厉害的进展值得跟进，所以我们并不需要用各种销售技巧把旧闻当成新闻来写。但至少应该诚实，带批判思维且真实地写每一篇文章，不是吗？

2017年7月《顶级数据团队建设全景报告》下载

关于转载
如需转载，请在开篇显著位置注明作者和出处（转自：大数据文摘 | bigdatadigest），并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑，可直接转载，转载后请将转载链接发送给我们；有原创标识文章，请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者，我们将依法追究其法律责任。联系邮箱：[email protected]。

志愿者介绍

回复“志愿者”加入我们

往期精彩文章

点击图片阅读

步长？填充？池化？教你从读懂词语开始了解计算机视觉识别最火模型 | CNN入门手册（中）