近日,电影《暮光之城》女主角 Kristen Stewart 的名字出现在了一篇 arXiv 论文的作者名单上,引起了极大的关注,一些读者将其评价为「颜值与智商双高的女神」。但抛开学术论文+电影明星的「自带光环」,这篇论文到底有多好呢?这个值得关注的问题已经出现在了问答网站 Quora 上,并且也吸引到了一些业内人士的观点,机器之心从中筛选了一些值得关注的答案进行了编译,了解更多观点可查看问题原地址:https://www.quora.com/What-do-people-who-work-in-machine-learning-and-AI-think-of-actress-Kristen-Stewarts-research-paper-on-AI
问题:机器学习和人工智能领域的业内人士怎么看待女演员 Kristen Stewart 的人工智能研究论文?
回答者一:Xavier Amatriain,前机器学习研究人员,现 Quora 的首席工程师
这里涉及两个不同的问题:(1)我们如何评价这篇论文?(2)怎么看待这次「上头条」?
首先回答第二个问题,因为我觉得这可能是问题的根本。今天人工智能的热度有一部分属于炒作,我也知道普通出版物(这里指报道这篇新闻的 Quartz——编译者注)会对一篇能将人工智能和好莱坞明星联系起来的论文感兴趣。也就是说,我认为 Quartz 的报道是把双刃剑。必须承认,我也在 Twitter 和 Facebook 上分享了这篇文章。
首先,请注意,Quartz 使用了「发布(release)」而不是「发表(publish)」。这个表述很好。后来,他们也解释了在 ArXiv 上发布论文并不意味着通过了同行评议或者被研究社区认可。读者应该记住,尽管 ArXiv 降低了提交的要求,但是,他们并不为论文质量负责。简言之,即使提交一份研究草稿或课程计划都是可以的。现在,在论文被其他刊物或会议接收前,都应该在这个语境中看待这篇研究。
第二,正如其他读者指出的,这不是「头条」所说的人工智能研究论文(research paper),而是一篇应用论文(application paper)。这完全是两码事。虽然这并不意味着它是一篇糟糕的论文,但是,需要根据不同的背景加以评价,因为该论文并没有介绍任何新的东西。据此,人工智能研究人员怎么看也就不是真的那么有关系了。
我觉得自己多少有点资格发表一下看法。尽管我是做深度学习研究的,但是我发表的论文实际上都是应用方面的,从推荐系统到多媒体系统。实际上,我和一些艺术家合作发表过论文,其中一些论文还发表在了国际会议和期刊上。
由此,我现在回答第一个问题:我怎么看这篇论文?
呃,不幸的是,我对它没多大印象。作为一篇应用人工智能技术的论文,其价值有限。也存在许多问题,这些都不利于它被绝大多数会议接收:
1. 从这一应用中获得的经验真的很难泛化,这篇论文甚至一开始就没有这个目标。
2. 研究方法的比较也非常有限。
3. 参考不够。特别是,作为一篇应用型论文,对现有的人工智能/机器学习领域内的论文参考不够。作者应该参考其他利用人工智能进行艺术创作的研究方法。
也就是说,比如,这篇论文可以提交给研讨会做「poster」。考虑其格式和长度,我猜这可能也是该论文的作者的想法。
最后,既然其他回答中已经讨论过 Kristen Stewart 是否是名副其实的合作者这个问题,那么,我也来回答一下:肯定算是名副其实的合作者。还是刚才说过的,这是一篇应用论文(或者说艺术创作应用论文)。艺人的作用与研究人员的作用不相上下,甚至超过后者。实际上,分享一点小秘密,我非常确定在该论文里描述的 Kristen 的贡献比许多在博士论文上署名的知名教授和研究人员还多。
这是一篇我与艺术家合作的论文,几年前发表在 IEEE Multimedia 上。
回答者二:Shashwat Verma,新加坡-麻省理工学院研究与技术联盟研究实习生
听说过 Prisma 吗?这个 App 将你上传的照片按你所挑选目标图片的风格进行重画。关于这个 App 的实现原理的论文是由 Gatys 等人完成的 https://arxiv.org/pdf/1508.06576v2.pdf
那些还不知道Prisma做什么的人可以看下面的例子:
第一步:上传一张图片
第二步:挑选一种风格
第三步:欣赏重画为目标风格的图片
Prisma 是通过卷积神经网络(CNN)完成上述的图片重画过程。我在上面所提到的论文是运用深度学习来做一些艺术性的创作工作而不是给猫分类这样的任务。这是一篇很好的论文,论文的写作很用心并且你可以运行出论文里所提到的结果。
Krister Stewart 的论文只是「延伸(extend)」Gatys 等人的工作。首先,她的研究论文不是一个真正意义上的关于人工智能的论文。他们甚至很可能都没有做一篇人工智能论文的意愿。让我们来分析这篇「人工智能」论文中第一个也是唯一一个数学公式。
Experimenting with the style transfer ratio led us to conclude that it needed to be exponent form for meaningful creative exploration. Subjectively, this exponential form gave us a useful measure of unrealness, u , a rough way to map how impressionistic the style transferred image looked: style transfer ratio = 10^u
以上内容为论文节选,唯一出现的数学公式为:风格转换系数=10^u
Kristen Stewart(可能是这篇论文最重要的一个作者)的论文的「贡献」根本谈不上是「贡献」(contribution)。评论结束。Gatys 的论文中早有谈及这个公式,甚至有对改变风格转换系数值所依次得到的效果呈现图。
这里补充给大家 Kristen 论文中的风格转换图(上)以及 Gatys 论文中的风格系数改变效果图(下),大家可以对比来看。(编译者注)
他们在论文中提到几个其他贡献,我相信,对于一篇论文来说,这些也是不够的。文中谈到几个参数(不是超参数)以及如何调这些参数。这完全不能构成一篇人工智能论文。他们只是把自己的工作像写博客那样让所有人知道。我个人没有发现他们论文中任何的价值点。没有一点能对我既有知识的进行扩充。
但是,这篇论文或许对那些打算在电影制作中用深度学习技术实现风格转换的人有用,对那些需要调整参数来得到足够好的产品输出图片的人也有用。
如果你真的想知道 Kristen Stewart 论文中那堆东西是怎么实现的或者说 Prisma App 的原理,那么你去读 Gatys 等人的论文吧。
最后,我认为,Kristen 甚至没有做任何与深度学习相关的技术工作。她很可能只是挂名在论文下面,就如那些没有参与任何论文研究的教授在论文下面挂名一样。Kristen 是一个演员不是一个深度学习工程师。这也是对该论文的作者、研究工程师 Bhautik J Joshi 的批评。
在我的分析里也许有错误的地方,非常欢迎大家挑出我错误的地方。
加油!
回答者三:Roman Trusov,Facebook 人工智能研究(FAIR)的 2016 年实习生
这不是一篇研究论文,也不是关于人工智能的。唯一真实的部分就是「Kristen Stewart」。
他们所做的:下载一个预训练了的直接可用的架构,然后在他们的图像集上运行了一下。你不需要为此做任何训练。要解决的问题是找到一个足够轻量的解决方案(vgg16 vs vgg19)以及设置一下去噪例程(denoising routines),这纯粹是个技术活儿。
如果去掉「Kristen Stewart」,在机器学习领域里,没人会看把这篇文章两遍,仅此一点就可以判断出里面有多少科学成分。
除此之外,试着减小 Erdős–Bacon 数字是一个不错的尝试,显然,这是真的。或许也能鼓励更多的女性踏入计算机科学领域。
现在,是时候行动起来了。
回答者四:Alex Seewald
Stewart 这次完成的工作更像是研究生的课程期末作业、人工智能爱好者发布的技术博客或本科生论文(thesis),却不像学术出版物。神经风格迁移(Neural style transfer)和与之相关的一切已经完成研究了。他们提到在实践中什么有效和无效的内容,对那些打算使用神经风格转移的人来说,是一些准确的信息(我在运用风格转移时,也有相似体验)。但是,说「在这些条件下,x 奏效但是 y 却不能」,这种深度的研究不能算真正的科学研究。
Kristen stewart 参与论文的事情让人们想知道她是如何参与的。通常仅列举作者名字的做法并不会真的给你这方面的答案。通常也没啥机会怀疑某人是否参与过论文。这一次,我并不相信,但是我想相信。我希望能在 CVPR 会议上遇见 Kristin Stewart。
©本文为机器之心编译,转载请联系本公众号获得授权。
✄------------------------------------------------
加入机器之心(全职记者/实习生):[email protected]
投稿或寻求报道:[email protected]
广告&商务合作:[email protected]