专栏名称: 两个质子
我们是谁?我们从哪里来?我们到哪里去?一群为科学着迷的普通人,一群为生活着迷的科学家。我们就是两个质子。
目录
相关文章推荐
赛先生  ·  如何健康地死去 ·  4 天前  
科普中国  ·  红斑狼疮真的不是绝症!!! ·  6 天前  
51好读  ›  专栏  ›  两个质子

AI创作的首张歌曲专辑即将面世,向音乐人发起挑战?

两个质子  · 公众号  · 科学  · 2017-06-08 19:28

正文

大约在70年以前,计算机科学家艾伦·图灵(Alan Turing)提出了判定人工智能的标准:一台计算机能够成功欺骗它的人类谈话对象,使其认为它也是人类。


而在这个春天的一个下午,巴黎第五区一条安静街道上的 Flow Machines实验室里,高级研究员Pierre Roy更关心的却是他的音乐创作AI能否写出迷人的歌曲。


 “到目前为止,从技术的角度来看,没人知道怎么样才能创作出一首好听的歌,或讲述出一个吸引人的故事,”他说,“现在这是AI领域的热门课题。”


Flow Machines是索尼计算机科学实验室(巴黎)的一个项目,这个项目由欧洲研究委员会提供资金支持。主要是为了开发出一种能创作出吸引人且具有专业水准的歌曲的AI程序,其他企业也有目的相同的项目,比如英国的Jukedeck和谷歌的Magenta项目。


自从图灵提出了他的测试标准后,流行文化关注的一直是拥有感知能力的AI,对其看法也褒贬不一。然而,现在AI这个词已经变成了一类软件的统称,只要是能够增强人类智能的软件都会算在内,这类软件通常是通过大数据挖掘来发挥作用的。这些软件已经变得在我们日常生活中随处可见,例如,我们用Siri寻找最近的墨西哥快餐店,听Spotify每周为我们推荐的个性化播放列表,或者是让Facebook在照片上自动标出你和你的朋友。


AI与传统的数据分析程序不一样的地方在于,AI能够利用机器学习算法来进行模式识别,而且能够在没有明确编程的情况下进行自主决策。


Flow Machines与这类AI没什么不同,它并不是一个具有自我意识的机器人,不会因为抒发情感而去写一首情歌,它只是一套分析了15 000首歌曲的复杂算法。


当这个项目的艺术总监Benoît Carré想要创作一首新歌的时候,他会设置程序,让它从数据库中粗略选择一些音乐,比如巴萨诺瓦风(bossa nova)的播放列表或是他最喜欢的Charlie Parker的曲调。他利用一种名为马尔可夫链的模型进行分析,确定这些歌曲的模式,然后模仿和变换,最终创造出自己的原创歌曲。


Flow Machines的艺术总监Benoît Carré


计算机会算出特定的和弦进程、旋律模进和节奏的出现概率,然后根据这些概率生成出新的而且合理的变化形式。


 “我们没有给机器设定音乐规则或是抽象的音乐知识,”Roy解释道,“机器只是从数据中学习从而创作出音乐。”


在这一过程中,Flow Machines系统仍需要人类专家的介入。Carré 可能会保留下来自己喜欢的一个8拍小节或是删除一个休止符,然后一遍一遍地跑程序,直到生成的旋律与和弦进程让自己满意。


2016年9月,Flow Machines发布了第一首歌《爸爸的车》,这首歌是一首具有夏天气息、快活的流行歌曲,根据披头士(Beatles)的曲调所作。这首歌曲调优美,但抹不去模仿的痕迹,在某种程度上会让人迷惑,触发一种对并不存在的记忆的怀念。和这首歌一同发布的是另一首名为是《影子先生》的歌,取材自美国流行金曲集(the Great American Songbook)。



所有风格上的修饰,包括和声、配器和歌词都归功于Carré。目前计算机能够写出的曲子仍非常基础,被录入数据库的歌曲只是最基本的形式——仅有和弦标签和一段旋律的简化乐谱,计算机也只能依赖这些作曲。Carré负责所有歌曲的后期制作,让歌曲拥有一些与众不同的亮点。


这让Carré拥有很大的权限去完善和制作每个小节,而且对程序所能诠释和创作的音乐类型施加了限制。


 “这个程序只能制作那些可以用一个简化乐谱(一种只是粗略的记下结构、和弦、律动、小节的谱子)来表示的音乐类型,”Roy说。“古典音乐是不行的,甚至techno或trance这类电子乐也是不行的。只有那些可以简化为音符与和弦的歌曲才行,比如西方流行乐。”


这种技术的局限性也引发了问题:当我们被某一段的音乐所打动时,究竟是什么让我们有这样的感受?那么我们能否期待机器能够产生这种感受呢,尽管这种感受对于人类而言是十分基础的情绪表达?


MIT AI实验室的创立者,也是该领域先驱的Marvin Minsky认为,人类能从独立的重复模式中体验到快感,因为它们能够让我们领会和享受时间这个概念。


神经影像技术的进步能够让我们更深刻地理解大脑产生这种感觉的原理。麦吉尔大学和罗特曼研究所的神经科学研究者发现,当人们在享受音乐时,大脑与奖赏和激励相关的部分会亮起。听到某段能够让我们反应强烈的音乐——那些能够让我们“颤栗”的曲子时——脑中多巴胺会迅速产生。多巴胺这种 “奖赏”神经递质通常与性、食物和坠入爱河的愉悦感联系在一起。


有趣的是,在预期情绪将达到高峰之时,多巴胺就会释放出来,跟达到高峰时一样。


作曲家、斯坦福大学音乐教授Jonathan Berger解释说,我们会对接下来听到的乐曲有所预期,而当实际上听到的声音以某种创造性的方式违背了我们的预期时(可能是作曲家的手笔,也可能是通过演奏者的诠释),就会让我们感到异常愉悦。


根据这个逻辑,在理论上AI应该能够找出人类期望的模式,加入适当的扰乱或延迟,最终创作出最令我们愉悦,让我们“颤栗”的曲调——不过《爸爸的车》这首歌告诉我们,还有很长一段路要走。


即便Flow Machines创作的歌曲吸引了很多人,但是Berger依然怀疑这个程序能否产生真正的艺术。


他说,除了模式重复及其变化,“音乐,至少伟大的音乐是多层次的,在多个时间尺度上展开。模式复制通常缺乏构成艺术重要方面的那种宏大的背景。


Flow Machines的团队反驳说,这并不是重点。他们认为自己的机器并不是用来替代艺术家的,而是一种增强人类创造力的工具。他们希望能全新的方向上运用这种工具。


 “真正好的音乐是听起来独一无二的,包括Benoît之前所做的音乐,”Roy所说的歌曲正是之前那首在实验室制作的歌。


Flow Machines将在年底之前发布整张专辑——第一次由AI作曲的专辑。在这张专辑的制作过程中邀请了很多艺术家参与,包括Ash Workman、英国合成流行乐乐队NZCA Lines和电音组合Darkstar。


Carré希望能够混合不同的音乐风格,但要在同一个概念主题之下把它们结合在一起。这张专辑的主题来源于Hans Christian Anderson的黑暗童话,这个童话讲的是一个作家丢失了自己的影子,然后又重新发现了它。


他说:“这个故事像是一面镜子,一出关于身份的戏,与我们现在做的事情放在一起看,很有趣。”他又补充道,在这个过程中同时可以实现他的一个目标:让AI创造出风格多样的音乐。


 “这个故事中的影子一直在旅行,走得路越多,也就变得越像一个生命,”Carré说。


值得一提的是,这个童话故事结局是,影子变得邪恶,与那名作家对调了位置,并杀死了他。或许邪恶的AI也是这样伴随着我们的。


Ed Newton-Rex是伦敦Jukedeck公司的创始人,这家公司负责为视频订制配乐音轨。Newton-Rex说,他创办这家公司的目的,在一定程度上就是想要让更多的人接触这个曾经只有少数精英参与的行业——至少在Newton-Rex自己接受专业训练的传统世界里是这样。


 “21年间我除了音乐什么都没做,在剑桥学习音乐之后中规中矩地成为一名古典音乐作曲家,”他说。“这其实也是一种民主化的体现,一旦计算机可以作曲,就能让那些并没有接受过大量音乐训练的人作曲,让他们参与到音乐创作的过程中来。”


但是不像Flow Machines,Jukedeck开始尝试让AI掌握创作歌曲的全部环节,包括让计算机将所做曲子合成一个完整的音轨。这项技术仍在发展的初期,但是Newton-Rex认为计算机总有一天能够完成一个飞跃,从模仿到真正具有创造力的艺术。


 “即使是最具开拓性的创新,也是建立在一些已有的模型或是之前的经验上,”他指出,“说了这么多,要回答计算机是否已经拥有了创造力,首先要定义什么是创造力。而创造力是什么,如何发挥作用,我们对此还没有达成共识。”


Jukedeck公司采用的技术与Flow Machines的有所不同,他们用的是模仿人类大脑的神经网络。与马尔克夫链的模型相比,这种技术需要更多的数据来进行训练,但是一旦学习完成,功能也将更加强大。


Roy和Carré直率地承认他们创造的东西在某种程度上超出了他们的掌控,但是这也正是令人兴奋的地方。


 “像饶舌或是迪斯科,某种新技术往往会催生出一种新的音乐风格,”Carré说。他指了指放在键盘、耳机和咖啡杯之间的Akai取样器,从20世纪80年代开始,Akai公司的产品让艺术家们能够在hip-hop风格的歌曲中使用古典音乐的音轨,并且可以在不用真正的鼓的情况下去制造击打乐。


 “刚开始很多人会担心钢琴家和鼓手会被取代,但是这种事情并没有发生,”Carré补充道,“去发现如何利用新技术做更有趣的事情,这才是人类啊。”