专栏名称: AI数据派
THU数据派"基于清华,放眼世界",以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯,定期组织线下活动,分享前沿产业动态。了解清华大数据,敬请关注姐妹号“数据派THU”。
51好读  ›  专栏  ›  AI数据派

算法VS数据,谁起决定作用?一场南北大佬的隔空「辩论」引发对于AI的终极思考

AI数据派  · 公众号  ·  · 2020-06-22 21:30

正文


来源:机器之能

本文约 2661字 ,建议阅读 6分钟
文介绍人工智能的终极命题:算法和数据谁更重要?

人工智能的终极命题:算法和数据谁更重要?

如果算法已经能自动生产,框架将会是核心竞争力吗?

如果框架仍然不能构成核心壁垒,那会是什么?

第三波人工智能浪潮越浪越勇,吸引着一批又一批的学界大佬迈出象牙塔,投身于产业机构和田间地头,要问为什么?

问就一句话,「那里有比研究院所更丰富的海量数据,有更接近用户的真实战场」。

这个逻辑进而衍生出一连串值得探讨的有趣话题:数据很重要,那么数据究竟有多重要?数据会比算法更重要吗?在机器学习领域里,究竟数据和算法哪个重要?

事实上,算法、算力和数据,一直以来就被称之为人工智能的「三驾马车」。这个问题看似无解,好比问自行车的前轮重要还是后轮重要?人的左腿重要还是右腿重要?整体中的任何一个部分对于完成任务而言都是不可或缺的。同样的,数据和算法在机器学习中也是不可或缺的。

但这并不妨碍从业者对「数据与算法」的探讨和交流 热情 ,也正是在这样的交流中,算法和数据的价值得到不断地延伸与挖掘。

数据VS算法,究竟谁更有竞争力?

「中国AI公司的优势并不是先进的算法,而是丰富的应用场景和大量的标注数据。正如文章所说: 『我们使用的算法中并没有多少内容是地球上随便哪个计算机科学研究生拿不到的。没有中国无与伦比的标注基础设施,这些数据成不了气候。』

近日,中国科学院大学教授、 中科院计算所先进计算机系统研究中心副主任包云岗借由一篇《经济学人》对于中国数据标注企业的报道在个人微博上展开了对于「数据及数据标注」行业的讨论,他呼吁在中国新基建的政策背景下,给予这个站在光鲜背后的行业更多关注和支持。

「一般大家都说人工智能有三个驱动力:算力、算法和数据。大家似乎对算力和算法关注得更多一些,而对数据的积累和处理关注就少很多。

最近看到一个企业『莫比嗨客MBH』,就是一个比较典型的数据处理企业,国内似乎对他们的报道很少,但《经济学人》却在一篇文章中把莫比嗨客放到与商汤、旷视科技同样的高度,甚至着墨更多。事实上,MBH也是一家2016年成立的公司,但已经发展到了30万人的规模。

现在各地都在新基建,其实政府在实施时,真可以考虑多支持一下这些数据处理『苦力』公司,他们似乎更符合新基建的内涵——提升信息处理能力、需要大量投入、可扩大就业。像莫比嗨客这样的公司,他们不仅为旷世商汤等提供标注数据,助力他们成为全世界知名的AI公司,同时也解决了大量的就业问题——莫比嗨客在西部雇了30万人进行数据标注,月薪3000元,是当地最低标准的三倍。

打个比喻,如果说旷世商汤是苹果公司,那么莫比嗨客就是富士康,也是人工智能产业链上不可或缺的一环。」

来自北京大学的网友「huangqundl」强调:

「但是并不是所有的数据都像文本、图像、语音这样可以找到大量廉价外包进行标注,比如网络数据标注就需要极高的专家知识,这就是为什么我对基于堆数据量的人工智能不感冒的原因。」

「 问题是数据和算法哪一个dominate?」 网友将问题的焦点转至数据和算法的排位上。

南京大学教授周志华加入了讨论,他是南京大学计算机科学与技术系主任兼人工智能学院院长。

周志华表示,「不是非此即彼的。 好比没有米做不了饭,但要是以为有了米就能开饭馆,那是想的太容易了。 那么开饭馆是米重要还是什么重要呢?

对于「算法比数据更为重要」的观点,包云岗回应称:

「中国AI公司的优势并不是先进的算法,而是丰富的应用场景和大量的标注数据。正如文章所说: 『我们使用的算法中并没有多少内容是地球上随便哪个计算机科学研究生拿不到的。没有中国无与伦比的标注基础设施,这些数据成不了气候。』







请到「今天看啥」查看全文