澎湃新闻记者 徐萧
听说这几天古诗词很火,各种专业骚客、民间高手、百年才子如雨后春笋涌现于神州大地,令人欢欣振奋。
恰好,澎湃新闻记者看到一些人工智能、AI、机器人——随便怎么叫都好——反正是非人类作的诗,被唬得不要不要的。各位姿势水平很高的澎友给看看。
先上诗,第一组:
问:哪首是人写的,哪首是机器写的?
是不是大写的服?
如果说二选一还是比较容易判断(蒙中)的,那再来第二组:
1、云峰
白云生处起高峰/鬼斧神功造化成/古往今来谁可上/九重宫阙握权衡
2、画松
孤耐凌节护/根枝木落无/寒花影里月/独照一灯枯
3、悲秋
幽径重寻黯碧苔/倚扉犹似待君来/此生永失天台路/老凤秋梧各自哀
4、春雪
飞花轻洒雪欺红/雨后春风细柳工/一夜东君无限恨/不知何处觅青松
5、落花
红湿胭艳逐零蓬/一片春风细雨濛/燕子不知无处去/东流犹有杜鹃声
问:这五首哪些是机器作的?
沃刚人的诗在宇宙里可能发生的最坏的事里排名第三位。——《银河系漫游指南》
公布答案:第一组左边一首,第二组中2、4、5是机器所作的诗。
从词语拼凑到基于深度学习技术的造诗机
实际上,以上的机器诗可以说是当下机器所能达到的较高,甚至可能是最高水准了。
知乎专栏作者萧瑟在《当AI邂逅艺术:机器写诗综述》一文中,认为机器诗歌生成的工作,起始于20世纪70年代。但在计算机诞生之前,就有好事者弄了个高频诗歌词语转盘,转到哪个词就记录下来,然后连起来形成一首“诗”。这种诗自然会出现类似“苹果吃姑娘,残红杀马特”,逻辑不通,不伦不类的句子。当然,也可能偶然搞出“澎湃是个好新闻”这样的佳句。
这个套路叫做“word salad”——把各种词语像沙拉一样拌在一起,在有了计算机后,被引入进去,成为早期的机器诗歌生成方法。
根据萧瑟的介绍,在词语沙拉法之后,机器诗歌的传统生成办法还有基于模板和模式的、基于遗传算法的、基于摘要生成的方法以及基于统计机器翻译的方法。这些方法,要么是诗句之间缺乏语义连贯性,要么缺乏灵活性,而且都有别于诗词领域的专业知识,需要专家设计大量的人工规则,对生成诗词的格律和质量进行约束。
但是,随着深度学习技术的发展,造诗机迎来了春天。基于RNN语言模型的方法,将诗歌的整体内容,作为训练语料送给RNN语言模型进行训练。训练完成后,先给定一些初始内容,然后就可以按照语言模型输出的概率分布进行采样得到下一个词,不断重复这个过程就产生完整的诗歌。
原理很复杂,记者也看不懂,就不多说了。反正结果就产生了开篇第一组中的那首。当然,正如前文说的,这首是水准较高的例子。还有这样的:
这样的:
这两首诗,上面的是网友用网络在线诗歌生成机器人——“编诗姬”生成的,下面的是澎湃新闻记者刚刚用该姬生成的,似乎很钟意“龟”这个意象。该姬的自我介绍是:编诗姬是采用语义分析与深度学习技术开发的诗歌生成机器人。在熟读了全唐诗五万首后,本姬可以自动根据您的需要三秒吟诗。雅韵传情,原创保证,来分享给您关心的人一首小诗吧。
看来同样是深度学习技术,学习的能力还是有差别的。
“机器诗犹如塑料花,入手即知”?
开篇第二组的机器诗,来自清华大学清华大学语音与语言实验中心(CSLT)。去年,就在AlphaGo战胜人类当下最杰出的一批围棋选手后,CSLT网站宣布,他们的作诗机器人“薇薇”通过社科院等唐诗专家评定,通过了“图灵测试”。所谓“图灵测试”是指通过对话分辨真实人类和人工智能的试验,通过“图灵测试”意味着人类无法通过语言对话分辨出人类和人工智能。
据CSLT网站公布结果,“薇薇”创作的诗词中,有31%被认为是人创作的。不过,在本次比赛中,“薇薇”创作古诗的水平还是未能超越现代人类诗人,双方的比分为2.72比3.20(满分5分)。
看来不仅是普通人,即便拥有一定创作经验的作者,要区分这种比较高明的机器诗也是有一定困难的。
澎湃新闻记者也将开篇两组诗,发给了一些旧体诗人。《荆棘鸟》译者、旧体诗人曾胡对于第一组诗歌,初始感觉是:很难判断,但觉得右边一首是人写的可能性较大,理由是“恨竹”这两个字机器很难仿写出。
曾胡随后将这两首诗发到了朋友圈进行测试,结果:“一半人猜对,都是学问比较好的,未见学问好的猜错。一位朋友说,机器诗犹如塑料花,入手即知。”
不过曾胡的这位朋友在面对第二组的五首诗时,却未能入手即知。曾胡则在反复细度之后,通过“孤耐凌节护”(句意不明)、“一夜东君”(东君指太阳,一夜东君语义矛盾)、“细雨濛”(濛字一般不单用)等语词、语义方面,判断出2、4、5为机器诗。
曾胡认为,因为测试的对比样本是现代人的古体诗词,与机器诗的分野并不明显,如果是唐诗,即便不是那么名篇佳作,那么可能就会容易许多。毕竟无论是Alpha Go还是百度机器人“小度”,这些人工智能所挑战甚至战胜的都是该领域人类最杰出的一批头脑,如果机器诗的比较样本,本身都没有多少独特性、创造性,那么该如何检验作诗机器人是否具有创造力呢?
艺术会成为人类最后的阵地吗?
AlphaGo、“小度”、搜狗“汪仔”、新闻写稿机器人,以及各种各样的人工智能不断的出现,并且取得了不俗的效果后,似乎未来独属于人类的领域越来越少,机器无法涉足的人类空间越来越少。
现在,被视为人类最后阵地的艺术也成为人工智能进军的方向。但是,无论是在文字艺术、图像艺术还是声音艺术方面,机器的表现都很难与人类媲美。
在清华作诗机器人之前,达特茅斯学院举办的“创意图灵测试”(Turing Tests in Creative Arts)周三宣布,这场竞赛并未选出最终优胜者,因为人工智能算法未能创造出与人类媲美的故事和诗歌。
在诗歌测试中,有两支参赛队伍分别创作了两首14行诗;在文学竞赛中,有3支队伍分别创作了一个简短的故事。这些内容都与人类创造的内容混在一起。最终结果显示,没有一篇故事或诗歌成功蒙混过关,只有一篇短篇故事让一位人类评审员判断失误。
看看谷歌人工智能所的英文诗,你或许就会明白为什么没人判断失误。
no. he said.
“no,” he said.
“no,” i said.
“i know,” she said.
“thank you,” she said.
“come with me,” she said.
“talk to me,” she said.
“don’t worry about it,” she said.
而在绘画和作曲上,机器的表现要比在文字上的好些,但也不尽如人意。
上图是德国贝特格实验室里进行的研究,研究人员能将毕加索、梵高、康定斯基和蒙克的风格应用到数字图像上。原照片(左上)分别被转换为不同的风格:特纳(J.M.W. Turner)的《米诺陶战舰的倾覆(The Shipwreck of the Minotaur)》风格(右上)、文森特·梵高(Vincent van Gogh)的《星夜(The Starry Night)》风格(左下)、以及爱德华·蒙克(Edvard Munch)的《呐喊》风格(右下)。
上图是谷歌Deep Dream根据照片所作的绘画,仍然是风格转移,也就是美图秀秀的滤镜水平。
众所周知,人与机器最本质差别是人拥有意识,机器没有。越高级的意识活动越具有独特性,这种独特性要求催生这种意识的对象独一无二:独一无二的诗歌,独一无二的绘画,独一无二的音乐。就目前来看,无论机器所写的诗、画的画、谱的曲多么以假乱真,甚至在审美上多么令人赞叹,但是不具有独特性、创造性的仿品也就不具有艺术价值,就像小孩子随意涂鸦也可以很好看一样。
参与研发搜狗人工智能“汪仔”的一位研究人员也对澎湃新闻记者表示,“从目前已经产出的人工智能写的诗歌、所画的画作来看,人工智能已经能做一些‘类艺术活动’,但和真正的‘创造’还有一定距离。”
“在一些重复性的脑力劳动中,机器已经开始具备比人类做得更好的能力。但是在一些需要创造力的领域中,目前机器的能力还需要继续提升。
“机器目前还有两个限制条件:第一个限制条件是它的工作环境相对封闭,输入的是一些固定有限的信息;第二个限制条件是有标准化解答。所以一项工作如果面临的环境越简单,最后的动作越标准,比如审计师、司机,就越有可能被机器取代。
“但是还有很多机器解决不了的问题,比如:创造力的问题、认知上的问题、人的好奇心的问题。人工智能到今天为止还只是帮助完成简单的重复性的脑力劳动,围棋其实也是接近重复性的脑力劳动,更加具有挑战性、更有创造性的事情还需要人类来完成。”
显然,在艺术的道路上,人工智能要走的路还很远。但是,没人能断定,未来不会真像科幻小说家刘慈欣预言的那样,人工智能可以拥有自我意识,产生情感,具备艺术创造性。
不过到那时候,又该如何界定人和机的界线呢?搜狗的这位专家的回应是:如果真有那么一天,那么未来人工智能与人的融合将会带来新的物种,这也是人类的自我进化。
这说法,是不是有点像《攻壳机动队》呢?