编者按:谷歌的人工智能作曲程序实现了数据化和规则化学习的结合,从而创作出了动听的乐曲——这种方式或可使得其他AI程序的构建更为容易。
在往下读之前,请先听一下这一小段音乐:
这段听起来很像手机铃声的乐曲就是谷歌的人工智能作曲软件的杰作。看到这读者们可能会想,“这段音乐也没有什么出奇的,听起来很正常啊”。
殊不知,这恰恰是它出奇之处。通过机器学习和乐理的结合,机器所作的曲子听上去和人类所做的曲子更加接近。
作曲是一种人类艺术创作的形式。虽然作曲软件不是什么新主意,但由依赖固定规则的软件所做出的乐曲听起来往往十分僵硬,不堪入耳。听歌软件的用户对此也应该有所体验,因为“推荐歌曲”这一功能也是基于此技术。
而当人工智能可以做出真正拟人的乐曲时,这代表艺术创作这项人类的骄傲也将开始受到人工智能的威胁。
作为人工智能业界巨头,谷歌是试图攻克“艺术创作”这个堡垒的先锋。做出此乐曲的人工智能软件就是谷歌Magenta项目之下的一个子项目。
Magenta是谷歌推出的全新研究项目,以探索利用人工只能来从事创作艺术,同时为开源机器学习系统TensorFlow的使用者简化这一过程。Magenta的开发团队隶属于Google Brain部门,目前有六名研究人员,未来还将邀请其他专业人士协助解决AI系统在创作上遇到的难题。
在项目初期,一个大型的神经网络被提供了数万首歌曲,用来学习预测每个音符之后的下个音符是什么。
当这个网络学会预测音符之后,它也可以把一小段音乐续写下去,然而最后的结果往往是一段松散的音符,没有任何结构和美感。
谷歌Magenta项目
但如今,这一缺陷已经被补上。谷歌人工智能作曲软件的项目负责人道格拉斯·艾克(Douglas Eck)协同实习生娜塔莎·雅克(Natasha Jaques)通过一个简单的方式使它所做的乐曲更接近人类,赋有美感。
这个方式就是使用强化学习手段对作曲系统增加简单的乐理规则:如果系统做出一段与之前所学的结构相似并且符合所有乐理规则的乐曲,就对它进行奖赏。
“这些规则是直接从乐理教科书中拿的,”艾克说道,“通过规则和强化学习的结合,以及从数万首人类作曲中学到的数据,此系统所做出的乐曲十分‘带感’”。
下面的些音节就是采取乐理强化学习之前的原始素材:
这段很明显十分生硬、难听。比文章开头那段经过乐理强化后的效果差出几条街。
虽然这只是一小段乐曲的改进,但其影响是巨大的。艾克表示,在强化学习中加入规则可以被应用于多个领域,比如机器人、推荐系统、以及翻译软件。
瑞士卢加诺大学(University of Lugano)教授于尔根·施密德胡伯(Jürgen Schmidhuber)对此说道:“没有任何原因指出机器不可以拥有好奇心和创造力”。施密德胡伯教授曾经在神经网络领域做出开拓性的研究,并且进行过使用强化学习得到“创造力”的实验。
他也表示,这种手段有着大量的实用可能:“医疗诊断方面就可以使用基于神经网络和规则的专家软件”。
强化学习往往被用于让人工智能软件学会很难被明确定义的规则。以围棋软件AlphaGo为例,围棋就是一个非常难被明确定义的游戏。规则简单,但每一手的好坏只有通过无数个小时的锻炼才能被“悟”出。不过此次证明了,有时候,明确的规则也很有用。
人工创造力的学者、加拿大魁北克大学(University of Quebec)的心理学教授斯蒂文·哈纳德(Stevan Harnad)表示,Magenta的成就很厉害,但是现在离机器真正拥有可以媲美人类的创造力还有很长一段路要走。
“深度学习算法很有希望,但目前它们还没有复制出人类平凡的非创造性能力,所以说它们可以复制创造力还是为时甚早”,他说道。“谷歌人工智能作曲软件最新的成果在听几遍之后也会感觉十分机械化。”
麻省理工科技评论首部中文图书
《科技之巅》现已上市
正在改变世界的科技事实,最值得投资人期待的技术
招聘
编辑、视觉设计、视频策划及后期
地点:北京
联系:[email protected]
MIT Technology Review 中国唯一版权合作方,任何机构及个人未经许可,不得擅自转载及翻译。
分享至朋友圈才是义举