李林 编译出品
量子位 报道 | 公众号 QbitAI
今天,2017年度计算语言学协会年会(ACL)评出了5篇最佳…论文,量子位整理介绍如下:
最佳演示论文:
Marjan Ghazvininejad, Xing Shi, Jay Priyadarshi, Kevin Knight,
Hafez: an interactive poetry generation system
论文:
http://xingshi.me/data/pdf/ACL2017demo.pdf
代码:
https://github.com/shixing/poem
这篇论文描述了一个由循环神经网络(RNN)和有限状态接收器(Finite State Acceptor, FSA)构成的自动诗歌生成系统“Hafez”,可以根据任意主题生成十四行诗。用户还能通过调整风格配置,来修改、润色这些诗歌。
论文的四位作者是南加州大学武凯文(Kevin Knight)教授和他的学生Marjan Ghazvininejad、史兴、Jay Priyadarshi。
他们去年就在EMNLP上发表了一篇生成诗歌的论文:Generating Topical Poetry; Marjan Ghazvininejad,还把诗歌生成软件做成了一个Alexa Skill(https://www.amazon.com/USC-Custom-Poetry/dp/B06X9HNFGC)以及一个网页Demo(http://52.24.230.241/poem/)
最佳演示论文第二名:
Guillaume Klein、Yoon Kim、Yuntian Deng、Jean Senellart、Alexander Rush
OpenNMT: Open-Source Toolkit for Neural Machine Translation
论文:
https://arxiv.org/abs/1701.02810
项目主页:
http://opennmt.net/
代码:
https://github.com/OpenNMT/OpenNMT
这篇论文由哈佛大学和机器翻译公司SYSTRAN联合发表,他们的OpenNMT是一个开源的神经机器翻译系统。
最佳资源论文:
Alane Suhr, Mike Lewis, James Yeh, Yoav Artzi,
A Corpus of Natural Language for Visual Reasoning
论文:
http://yoavartzi.com/pub/slya-acl.2017.pdf
项目主页:
http://lic.nlp.cornell.edu/nlvr/
数据集:
https://github.com/clic-lab/nlvr
这篇论文由康奈尔大学和Facebook AI研究院共同发表,给出了一个新的视觉推理语言数据集,其中包括92244对自然语言陈述和生成图片,以及3962个句子。
ACL 2017的程序委员会这样评价这篇论文:
我很欣赏这篇论文中的sanity check,它确保了在不理解这些数据集的情况下,无法解决相关问题。
最佳短论文:
Bogdan Ludusan, Reiko Mazuka, Mathieu Bernard, Alejandrina Cristia, Emmanuel Dupoux,
The Role of Prosody and Speech Register in Word Segmentation
论文:
http://aclweb.org/anthology/P17-2028
这篇论文由法国巴黎高等师范学院、法国高等社会科学院和日本理化学研究所共同完成,探索了语体和韵律在段词中的作用,结果显示,语体的作用比此前热门所认为的要小,而韵律边界信息在成人语言中比在婴儿语言中发挥着更大的作用。
众所周知,把研究结果写成短论文很难。在委员们推荐的论文中,只有这一篇符合程序委员会的“最佳短论文”标准:
(a)是作为短论文而写的,不是省略了细节的长论文;
(b)包含论文中应该包含的所有元素;
(c)作为一篇短论文,它是“最好的”。
最佳长论文:
Ryan Cotterell, Jason Eisner,
Probabilistic Typology: Deep Generative Models of Vowel Inventories
论文地址:
https://arxiv.org/abs/1705.01684
这篇论文来自康奈尔大学,将统计学方法引入类型学研究,用来解答这个经典的问题:一个自然的元音清单的如何形成的?
语言类型学研究人类语言中的各种不同结构,探索哪些结构、现象是各种语言的共性,哪些是很少出现的。元音清单就是其中的问题之一:所有语言都有元音,但并不是所有语言都包含u这个音。
程序委员会将这篇论文选为“最佳长论文”,是因为它将“古典”生成模型和神经网络结合起来,探索负责的语言学问题。
论文的第一评审这样评价它:
我对这篇文章印象深。它以微妙而恰当的方式使用了现代的深度学习工具。这篇论文为了达到前人方法未能完成的明确目标,而进行了计算。
现在,我们可以评估一个完整的元音清单出现的概率,而不再局限于根据一个元音来猜测另一个元音出现的可能性。
8月9日(周三)晚,量子位邀请三角兽首席科学家王宝勋,分享基于对抗学习的生成式对话模型,欢迎扫码报名 ▼
量子位AI社群6群即将满员,欢迎对AI感兴趣的同学加入,加群请添加微信号qbitbot2;
此外,量子位的专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进群请添加微信号qbitbot2,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。