专栏名称: 探客Tanker
极具深度的科技行业分析自媒体平台,汇聚国内外最前沿的科技产品,同时关注智能硬件创业领域。
目录
相关文章推荐
爱范儿  ·  iPhone 17 Air ... ·  昨天  
新浪科技  ·  【#苹果探索AppleWatch拆卸充电## ... ·  2 天前  
极客公园  ·  充电 5 分钟、续航 400 ... ·  2 天前  
51好读  ›  专栏  ›  探客Tanker

最强人工智能横空出世!自学3天,阿尔法“新狗”100比0完败“老狗”!

探客Tanker  · 公众号  · 科技媒体  · 2017-10-20 18:00

正文


| 有趣·新鲜·有料 |

添加   kejizhushou  内部福利等你


1


人工智能迎来了一个里程碑!


伦敦当地时间10月18日,谷歌人工智能团队DeepMind公布了最强版AlphaGo(阿法狗) ,代号AlphaGo Zero(阿法元)。


“阿法狗”曾横扫围棋高手,韩国李世石、中国的柯洁等,人类的顶尖高手都是其手下败将。但 “阿法元”对阵“阿法狗”的比赛结果是:100 : 0 ,压倒性优势。


更重要的是, “阿法狗” 学习下围棋是从被输入和解析人类棋谱开始的, 花几个月的时间,学习三千万棋局 ,才打败人类;而 “阿法元” 从零基础起步, 一开始就没有接触过人类棋谱。


研发团队只是让它自由随意地在棋盘上下棋,然后进行自我博弈。通过这种办法, 只花了3天时间,自己左右互搏490万棋局,它就成为了顶尖高手! 对此,少年天才柯洁甚至感叹, “人类太多余了”。


AlphaGo Zero学到的围棋知识(图片来源:DeepMind 论文)



2


不再受人类知识限制,只用4个TPU


“阿法狗”依靠的是多台机器和48个TPU(谷歌专为加速深层神经网络运算能力而研发的芯片)。“阿法元”则非常“低碳”,只用到了一台机器和4个TPU,极大地节省了资源。


“阿法元”采用的是新强化学习技术 ,由于整个对弈过程没有采用人类的数据,因此它的棋路独特,不再拘泥于人类现有的围棋理论。


美国的两位棋手对阿法元的棋局做了点评:它的开局和收官和专业棋手的下法并无区别,显示人类几千年的智慧结晶,看起来还是有价值的,但是中盘看起来则非常诡异。


这也就是说,人类不会那么下围棋,但“阿法元”独立发现了游戏规则,并走出了新策略,为围棋这项古老游戏带来了新的见解。 计算机走出了自己的路。







请到「今天看啥」查看全文