探寻商业本质
品途解读:经过六小时比赛,最终执黑的柯洁以约四分之一子的微弱劣势,败给AlphaGo。
文/赵子潇
“无论输赢,这都将是我与人工智能最后的三盘对局。”
5月23日,中国乌镇围棋峰会今天上午在浙江乌镇正式召开,围棋世界冠军柯洁九段将在未来5天内挑战围棋人工智能AlphaGo。与去年AlphaGo 与李世乭对战时采用的五局三胜制度不同,本次柯洁与AlphaGo的对决通过三局两胜来定出胜负。而柯洁对战AlphaGo前夜,柯洁在微博撰文表示,未来是属于人工智能的,也正因为如此,他今后都不会再与AI比赛。“它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱。对它而言...它的热情——也只不过是运转速度过快导致CPU发热罢了。”
尽管宣称自己会奋力一搏,柯洁还是透露出自己不安的情绪:与AlphaGo的最终对决恐怕凶多吉少。
经过六小时比赛,最终执黑的柯洁以约四分之一子的微弱劣势,败给AlphaGo。
虽然这只是第一场比赛,但比赛成绩对柯洁来说很不利。DeepMind创始人及CEO戴米斯·哈萨比斯在赛前表示,无论结果如何,最终胜利都属于人类。从双方的态度来看,比赛结果似成定局。对于机器打败人类,人们并不担心。毕竟机器超过人类只是时间问题。有知乎网友评论:“人没必要跑的比汽车快,能否为人所用才是最重要的。”
历史对弈
这并不是柯洁第一次输给AlphaGo。在2016年年末,AlphaGo化身Master在网上以30 秒快棋的方式战胜柯洁九段、陈耀烨九段、朴廷桓九段、芈昱廷九段、唐韦星九段等高手;1 月4 日,Master战胜了中国“棋圣”聂卫平,最终在1 月4 日晚间,Master 在连胜60 局之后露出真身,DeepMind宣布,AlphaGo 已经升级到最新版本。
而在AlphaGo对战李世石的时候,柯洁的微博是另外一副光景:“就算阿法狗战胜了李世石,但它赢不了我”;“来吧!管你是阿法狗还是阿法猫!我柯洁在棋上什么大风大浪没见过?让风暴再来的猛烈点吧!这个B我就装了怎样!”
DeepMind曾表示Master是一场“非正式 ”的比赛,因而本次乌镇的人机大战就成为了人工智能能否超过人类的标志性事件。
在比赛过程中,双方的差距已被逐渐拉开,当柯洁剩余时间仅60分钟时,AlphaGo还有两小时16分钟;柯洁剩余32分钟时,AlphaGo剩余2小时3分钟。
柯洁下棋过程中思考良久,并在97手时下出天马行空的一招。创新工场人工智能工程院副院长王咏刚评价说:“这分明就是两个AI在下棋!讲输赢仍然悲观,但柯洁在人类里足以封神!”
人工智能的初步胜利
AlphaGo战胜了李世石,不到一年时间内又以60连胜的成绩击败一众围棋高手,包括棋圣聂卫平和本次对战的柯洁。经过自我学习和进化,AlphaGo达到了2.0版本。
据搜狗CEO王小川表示,AlphaGo 1.0 混合了三种算法:蒙特卡洛树搜索+监督学习+增强学习。其中蒙特卡洛树搜索是一种优化过的暴力计算,比1997年深蓝的暴力计算更聪明。而这里的监督学习,是通过学习3000万步人类棋谱,对六段以上职业棋手走棋规律进行模仿,也是AlphaGo获得突破性进展的关键算法。而增强学习作为辅助,是两台AlphaGo从自我对战众中学习如何下棋,据悉对棋力提升有限。当AlphaGo战胜李世石后,DeepMind创始人Hassabis也很震惊,因为他发现AlphaGo居然有自己的棋路。
而AlphaGo2.0的技术原理与之前有着巨大不同:
1. 放弃了监督学习,没有再用人的3000万局棋谱进行训练。这本是AlphaGo最亮眼的算法,也是今天主流机器学习不可避免的核心条件:依赖于优质的数据,在这个特定问题下就这么被再次突破了。
2. 放弃了蒙特卡洛树搜索,不再进行暴力计算。理论上,算法越笨,就越需要暴力计算做补充。算法越聪明,就可以大大减少暴力计算。从AlphaGo 2.0的“马甲”Master的历史行为看,走棋非常迅速,约在每10秒钟就走棋一步,如此速度很可能是放弃了暴力的计算。
3. 极大地强化了增强学习的作用,之前敲边鼓的算法,正式成为扛把子主力。在这样的算法下,AlphaGo 2.0对计算资源开销极小。
柯洁曾经评价说:“AlphaGo出现,很多理论都被推翻,再看以前定式变得好笑,亏那么多目就不再是两分。”
经过这一战,人工智能已经渗透到了大众的眼中,而这只是人工智能发展的开始,推动科技发展。
比如AlphaGo,其系统的变体就可以来服务其他行业,DeepMind就打算将其中一种变体应用于医疗行业,着力解决蛋白质折叠的问题。创始人称,目前还没有实现,但是从初期结果来看很有希望,可能再过一年就可以提供给制药公司,通过虚拟的方式,模拟针对某些蛋白质药物的设计,用来治疗各种疾病。
人工智能用了60年战胜人类,全面超越人类似乎不需要比这更长的时间。