专栏名称: CSDN
CSDN精彩内容每日推荐。我们关注IT产品研发背后的那些人、技术和故事。
目录
相关文章推荐
雷科技  ·  史上最窄边框!这手机太狠了 ·  昨天  
新浪科技  ·  【#iPhone17有望全系标配24MP自拍 ... ·  2 天前  
成都日报  ·  2025年3月18日|成都海报 ·  3 天前  
51好读  ›  专栏  ›  CSDN

观点 | 深度学习,先跟上再说

CSDN  · 公众号  · 科技媒体  · 2017-06-19 11:59

正文


文 | 孟岩


H是我认识的一个互联网老炮,十多年前 Web 2.0 刚刚兴起的时候,他做了几个创业项目,基本上都是 Copy 2 China 类型的,虽然没有像美团的王兴一样取得特别大的成功,但其中终于有一个在光景尚好的时候脱手卖掉,也算早早的实现了财务自由。中间有好几年我跟他没有什么联系,断断续续的消息说,H 开始做一些投资,而且收益不错。

前几天在一个意想不到的场合突然见到 H,聊起彼此最近的兴趣点,他竟然狮子大开口,滔滔不绝的讲起深度学习来了。而且交流之中,我发现他对于深度学习的理解程度还真不只是停留在高瞻远瞩的互联网口炮层次上,而是针对一些具体技术问题下过功夫钻研。当然,他本人就是国内 Top 5 名校计算机科班出身的高材生,真下功夫研究这些东西是没有问题的,但令我奇怪的是,你一个浓眉大眼搞投资的,不缺钱也不缺机会,你苦哈哈的去给神经网络调超参,你图什么呢?要是说你天性爱技术,逮什么学什么,那 当年 Node.js、VR/AR和区块链火的时候也没见你往里冲啊,为什么对深度学习就这么上心呢?

我把这个问题抛给他,他想了想,说了一段挺实在的话:

“其实是因为 不得已 。为什么?因为深度学习结合力太强。它可以放在各个场景下,给各个领域带来冲击。我们不知道这个东西能用在多少地方,有多大的潜力,能搞出什么名堂。别的技术,你大概可以设想出它极大发展之后所能达到的那个状态。比如说,区块链彻底重构互联网,一切数字产品皆可资产,代码即法律,所有的交易都自动履约完成;比如说,物联网给每一粒灰尘赋予一个 IP ,纳米机器人在我们的血液里纵横,消灭一切疾病;比如说, VR 创造出的虚拟世界让人难辨真伪,一辈子体验几十辈子的人生,等等,这些事情,不管多么科幻,你都可以想得到,它有一个明确的方向。有方向就好办,你可以选择说这个方向我要跟,或者这个方向我不跟。但是深度学习不一样,你不知道它能力的边界在哪里,更没有明确的场景限制。几乎在你可以想到的任何事情中,你都可以构造一个复杂的网络,然后就把数据灌进去开始学啊学啊,蛮不讲理的就可能得出一个更好的结果。在竞争当中,这种武器是最可怕的,没有固定的形态,放到哪里都有可能弄出一个意外的大杀器。这种武器,如果别人有而你没有,不知道对方在什么地方、什么时候就突然拿出一个核弹把你炸得渣都不剩,你的准备、经验和积累完全不起作用,而且在此之前你完全预见不了。这种感觉太可怕了,因此我必须直接掌握这个工具,这个不是技术情怀,也不是前瞻,而是 不得已 。”

不得不说这是一个很有说服力的观点。

之前我也了解了一点深度学习,用 TensorFlow 搭了几个模型,也看了一些论文。有两个突出的感受。第一, 深度学习这座山,你不爬到一定高度,其实做不出什么新东西来,这跟之前的移动互联网是两码事。 跟着网上的教程把例子做出来并不难,但是解决新的问题,并不是谁都能做到的,不客气的说,绝大多数人做不到。即便现在深度学习已经这么火了,能够把这个方法用在新的领域,创造新的网络结构,解决新的问题,这样的研究者也是凤毛麟角,屈指可数。第二, 很多事情深度学习干不了。 Bharath Ramsundar最近写了一篇文章,介绍了深度学习干不了的那些事,洋洋洒洒列了十多条。其实之前某些媒体把深度学习描绘成为强人工智能的最终解决方案,就是很不负责的。真正在这个领域的人都知道,这一波深度学习的技术并不能支持强人工智能,现在很多普通围观群众对 AI 的憧憬,多半将再一次落空。

所以,不容易学成,学成之后也有好多事情还干不了,那么究竟值不值得跟进深度学习?这其实一直是我内心的一个问题。

H 的一席话点醒了我。深度学习其实是一个我们这五年不得不去跟进的方向,因为它的结合性强,它的应用形态不可预测,它是一个“脑洞”科技。 确实,它有很多事情干不了,但反过来,它能干成哪些事,也不是你能预见的。因为深度学习真正的威力不在于技术,而在于使用这个技术的人。 你不知道你的对手会在哪个行业出现,从哪个地方开一个脑洞,对你现在所做的事情、对于你的经验、优势和自信心进行降维打击。

我并不是在耸人听闻。关于深度学习在计算机视觉、语音、自动翻译、自动驾驶等领域的进展,相关报道最近几年来已经汗牛充栋,我们已经逐渐消化了这些消息所带来的冲击,不再觉得惊奇。但是如果你以为深度学习只有这些本事,自己只要避开这些领域就可以不受冲击,你可能就太乐观了。

2012年9月,Kaggle 举办了Merck分子活动数据挖掘大赛 https://www.kaggle.com/c/MerckActivity 。各路分子生物学、医学、化学和药学数据科学团队纷纷出场,激烈厮杀。这个时候,Geoffrey Hinton 的博士生团队拎着深度学习大杀器闯进赛场,仅仅用了两个星期,就把各路高手纷纷干翻,夺得冠军。重要的是,这个冠军团队是清一色的计算机和深度学习专家,一点生物、医学、分子、化学背景都没有。难道资深专业人士在深度学习面前如此不堪一击吗?这件事情当时震撼了科技界,连《纽约时报》都进行了报道 http://www.nytimes.com/2012/11/24/science/scientists-see-advances-in-deep-learning-a-part-of-artificial-intelligence.html 。不过今天看来,这件事只是一幕序曲。 未来相当长的一段时间里,很多行业都可能会出现一批用深度学习武装到牙齿的野蛮人,以你意想不到的方式,从你意想不到的角度对你进行暴击。

你还记得2006年 Netflix 推出的百万美金大奖赛吗 http://www.netflixprize.com/ ?当时 Netflix 悬赏100万美金给第一个能够将其影碟推荐算法性能提高10个百分点的团队。时隔三年之后,经过不断的努力,终于有团队拿到奖金。冠军团队的算法以集成算法为基础,整合了107种不同的优化技术,最后提高了10.06%。而2016年,有人用 Keras 写了一段不到20行的深度神经网络程序 https://karthkk.wordpress.com/2016/03/22/deep-learning-solution-for-netflix-prize/ ,经过40个 epoch 迭代,效果非常接近当年的冠军。这就是深度学习的威力。

京东在618这一天启用了 配送机器人 ,一天之内在人大校园内配送了20单。这个机器人能够自动避让行人,应该有深度学习的支持。这个机器人的出现,当然是京东的创新,但另一方面,这也是对京东引以为傲的配送铁军的威胁。智慧物流发展到高度自动化的阶段,一辆大型物流车一路开一路沿途放下配送机器人,用户通过手机开锁取货,今天必须由快递员完成的大部分配送工作,未来靠机器人就可以完成。物流业将变成什么样?电商将变成什么样?

金融量化交易领域 ,传统的算法交易系统研究已经多年,有研究先行指标的,也有用传统机器学习算法调了很久的模型,也出现了像 MetaTrader 这样的自动交易机器人开发平台。大家正在不断积累盖楼,其乐融融。现在突然出现一组人,用深度学习和深度增强学习杀到这个领域里。他们悄悄的进村,打枪的不要,但是出手不凡,在选股策略和价格预测等方面已经取得很大的成功。现在来看,很有可能深度学习在很短的时间里能把老炮们辛辛苦苦积累了多年的大部分指标和模型抛到垃圾堆里。有兴趣了解的可以参考这个文档







请到「今天看啥」查看全文