专栏名称: AI开发者

AI研习社，雷锋网旗下关注AI开发技巧及技术教程订阅号。

春节对联哪家强，人工智能对得狂！

AI开发者 · 公众号 · AI · 2020-01-29 08:00

正文

作者 | 十、年

编辑 | Camel

腊月二十八，离春节又近了一天，按照传统习俗，这两天是就该贴春联了。

AI科技评论在此送给大家两幅对联，祝大家心想事情，每天快乐。

上联：五湖四海皆春色;

下联：万水千山尽得辉；

横批：万象更新

上联：欢声笑语贺新春;

下联：欢聚一堂迎新年；

横批：合家欢乐

春联传统源远流长，一幅写春联的需要极高的文学素养，不仅要求平仄齐整、意境对称，还要表达辟邪除灾、迎祥纳福的美好愿望。

但是对于现代人来说，由于对传统文学的生疏和缺乏对对联的练习，对对联变得不容易了。

但是人工智能技术普及的今天，攻克对联难关早就有人来尝试进行了。

其中最为著名，最富有文学气息的当属微软亚洲研究院的对联系统，其由微软亚洲研究院副院长周明负责开发，并能够利用本交互方式可以随意修改下联和横批。如下图所示，就“千江有水千江月”一对就可对出“万里无云万里天”。

地址：http://duilian.msra.cn/default.htm

不过，在新奇以及个性化方面不如最近新崛起的百度春联系统，百度开发的对联系统有刷脸出对联以及藏头对联等系统。如下图所示，以人工智能为题眼，AI给出的一幅对联。

手机打开哟：https://aichunlian.cctv.com/?from=singlemessage&isappinstalled=0

不仅能刷脸生成对联，还可以预测合成你20岁年纪模样。我们用李飞飞博士的一张照片试了一下，可以在下方滚动区域清晰的看到每一步的文字。结果显示预测年龄为32岁，AI给颜值打80分。另外，生成的李博士20岁的照片颇为青春(*￣︶￣)。

当然，还有去年非常火的个人版AI对联，设计者是本科毕业于黑龙江大学计算机专业，硕士毕业于英国莱斯特大学读计算机硕士的王斌。从测试结果（如下图）来看，对于一般的对联效果也是杠杠滴~

对联地址：https://ai.binwang.me/couplet/

据介绍，这个AI的训练，是基于深度学习seq2seq模型，用到了TensorFlow和Python 3.6，代码已经开源，你可以自行打开下面的GitHub地址下载开源代码尝试训练。另外，训练它所用的数据集来自一位名为冯重朴_梨味斋散叶的博主的新浪博客，总共包含超过70万副对联。

开源代码：

https://github.com/wb14123/seq2seq-couplet

训练数据集：

https://github.com/wb14123/couplet-dataset

所以想自己写春联的，但又憋不出大招的小伙伴，可以使用上述任一AI系统打造出属于你自己的对联。

AI对联背后的技术

关于AI对联所采用的技术，微软周明在博客中曾经写过这样一段话：“我设计了一个简单的模型，把对联的生成过程看作是一个翻译的过程。给定一个上联，根据字的对应和词的对应，生成很多选字和候选词，得到一个从左到右相互关联的词图，然后根据一个动态规划算法，求一个最好的下联出来。

从上述文字我们可以知道，AI对联采用的是一系列机器翻译算法。和不同语言之间的翻译不同的是，给出上联，AI对出下联是同种语言之间的翻译。

这也就是说对联系统的水平直接依赖于机器翻译系统的发展历程。

机器翻译的最初的源头可以追溯到1949年，那时的技术主流都是基于规则的机器翻译，最常见的做法就是直接根据词典逐字翻译，但是这种翻译方法效果确实不太好。

“规则派”败北之后，日本京都大学的长尾真教授提出了基于实例的机器翻译，即只要存上足够多的例句，即使遇到不完全匹配的句子，也可以比对例句，只要替换不一样的词的翻译就可以。但这种方式并没有掀起多大的风浪。

1993年发布的《机器翻译的数学理论》论文中提出了由五种以词为单位的统计模型，其思路主要是把翻译当成机率问题，这种翻译方式虽然在当时风靡一时，但真正掀起革命的还是2014年深度学习的兴起。

2016年谷歌正式宣布将所有统计机器翻译下架，神经网络机器翻译上位，成为现代机器翻译的绝对主流。

具体来说，目前市面上的AI对联基本上都是基于attention机制的seq2seq模型的序列生成任务训练而成。seq2seq模型又叫Encoder-Decoder。

关于此模型AI科技评论之前曾经写过一篇文章详细介绍，尚未理解的读者请戳此《完全图解RNN、RNN变体、Seq2Seq、Attention机制》阅读。

现在我们也把关键部分摘要如下：

Encoder-Decoder结构先将输入数据编码成一个上下文向量c：

得到c有多种方式，最简单的方法就是把Encoder的最后一个隐状态赋值给c，还可以对最后的隐状态做一个变换得到c，也可以对所有的隐状态做变换。

拿到c之后，就用另一个网络对其进行解码，这部分网络结构被称为Decoder。具体做法就是将c当做之前的初始状态h0输入到Decoder中：

还有一种做法是将c当做每一步的输入：

由于这种Encoder-Decoder结构不限制输入和输出的序列长度，因此应用的范围非常广泛。

Attention机制

在Encoder-Decoder结构中，Encoder把所有的输入序列都编码成一个统一的语义特征c再解码，因此，c中必须包含原始序列中的所有信息，它的长度就成了限制模型性能的瓶颈。如机器翻译问题，当要翻译的句子较长时，一个c可能存不下那么多信息，就会造成翻译精度的下降。

Attention机制通过在每个时间输入不同的c来解决这个问题，下图是带有Attention机制的Decoder：

每一个c会自动去选取与当前所要输出的y最合适的上下文信息。具体来说，我们用aij衡量Encoder中第j阶段的hj和解码时第i阶段的相关性，最终Decoder中第i阶段的输入的上下文信息 ci就来自于所有 hj 对 aij 的加权和。

春节对联哪家强，人工智能对得狂！

正文

请到「今天看啥」查看全文