文|汤倩
戴文渊,大学时带领三人团队夺得ACM世界冠军和三个亚洲冠军;曾是百度最年轻的高级科学家,三年从T8升到T10。现在,作为人工智能领域的代表,他和他创立的第四范式正在成为整个行业的标杆。
2005年,在上海举行的ACM中,戴文渊所在的上海交通大学代表中国队参赛。作为历史最悠久、规模最大、级别最高的的国际大学生程序设计竞赛,ACM素来被冠以"程序设计的奥林匹克"之称。在那年的比赛中,戴文渊和他的三人小组在五个小时内完成了十道题中的八道,以高出第二名整整一道题的成绩获得世界冠军。
随后,戴文渊在交大继续硕士和博士连读的学生生涯,并指导学弟学妹多次拿到ACM的亚洲冠军。同时,他在人工智能的研究领域也是颇有建树,学术论文多次被NIPS, ICML, AAAI, KDD等国际顶级学术会议收录。
随着互联网的飞速发展和数据量的增加,戴文渊认为人工智能落地的时机正在慢慢来到,AI有可能从实验室实现产业落地,于是他决定找些企业聊聊自己的想法。在机缘巧合之下,戴文渊接触到了当时百度凤巢的负责人,因为相同的理想和情怀,2009年5月,戴文渊决定正式加入百度凤巢。入职时,他的title以是高级工程师,而在试用期过后,就破例升至T8级别。对于年轻的戴文渊而言,T8级别不仅体现了百度对于戴文渊在AI领域的发现和创新的肯定,也意味着百度对其未来所能创造价值的深切厚望。
2009年,百度凤巢已经推出了一段时间,虽然整个凤巢的收入还在稳步增长,但在技术上却遭遇了瓶颈,效率很难得到提高。为了寻找和开拓新的收入增长点,凤巢组建了数个小团队,包括博弈论小组,大数据小组,以及戴文渊的AI小组等。最终,由戴文渊与几位实习生组成的AI小组取得了巨大的成绩,并最终把其他几组人才吸引过来。
对百度来说,过去的广告投放流程是专家制定策略,形成规则。尽管当时百度已经有约一万条规则,但这个数量对百度的搜索数据而言还是很小的。戴文渊利用机器学习技术,让机器在很短的时间里轻松写到一千万条策略,在制定更精细广告投放规则的同时,相对人工的效率提升了一千倍,带来的收入较以往平均水平提升了40%。
在随后几年时间内,戴文渊一直专注于通过开发机器制定规则。到2013年,百度凤巢已经拥有一千亿条规则,而他也已经是一位带领数百名研发人员的T10科学家,在百度内部被称为“戴神”。但是,在入职百度满四年时,他选择了离开。因为戴文渊认为自己身上的标签应该是人工智能,而非广告。当时在百度,他只能把人工智能落地化到广告这一个场景,而他想把人工智能的福利带给更多人。
从百度离职后,戴文渊去了香港,加盟华为,担任诺亚方舟实验室主任科学家,做TOB的企业服务,尝试用企业服务的方式做AI,把华为大数据产品提供给客户。“我当时的工作性质有点类似于售前工程师,把产品的价值传递给客户,在专业人士和普通人士之间建立一座桥梁,将产品转变成普通人可以理解的模式。
2014年,戴文渊离开华为,次年便和机器学习领域的顶尖科学家、资深工程师、金融和咨询专家一起,创立了行业领先的人工智能技术与服务提供企业——第四范式,并担任CEO。
戴文渊说道,“第四范式这个词最早是在2005年提出来的,即用机器和数据写规则。在“第四范式”之前还有:第一范式原始人记录自然现象,钻木取火下次重复;第二范式理论科学,总结出规律,后人知道规律就可以,比如牛顿物理学等;第三范式计算机推演,做的更复杂,比如核试验,天气预报等。所以,我们第四范式就是致力于要让机器干牛顿的事,看到数据总结规律”。
第四范式秉持“AI for everyone”的理念,基于应用场景开发出显著提升竞争力的行业解决方案。 戴文渊认为这个业务发展将经历三个阶段:第一个阶段将算法作为“屠龙刀”,即打造平台,开发产品和服务;第二个阶段“摘叶飞花皆可伤人”,即应用阶段,不拘泥某种具体算法,即使很low的算法也能玩出很棒的花样,比如帮助企业进行决策,是否投放一条广告、要不要向市场推出一种产品;第三个阶段“无招胜有招”,平台会分层,找最合适的技术,自行造出一把新的“屠龙刀”。
“我们正在尝试用AI改变很多行业的传统工作方法”,戴文渊说,“以金融行业为例,AI可以成为最好的风控专家,银行现有的反欺诈专家系统无法与AI媲美。近期,我们为一家大型银行设计和上线了反欺诈模型。我们的工程师通过快速理解客户的需求,依靠机器设计和实现目标模型,帮助该行的反欺诈工作效率较以往提升了四倍之多”。
在第四范式现在的员工中,研发人员占比70%,除了算法科学家之外,还有大量开发工程师在负责产品落地化。为了实现“AI for everyone”,第四范式自主研发出国内首个面向应用者的人工智能开发平台——“先知”,该平台为企业提供快速完成AI转型的便捷方式。基于“先知”,企业工程师甚至是业务人员,能够在1人月内开发出适用于本行业的人工智能应用。“我们就是这样一家很酷的企业”,戴文渊笑道,“我们的愿景是让人工智能触手可及”。
在戴文渊看来,现在人工智能的应用场景还是冰山一角,距离多领域、多场景的广泛爆发和商业化落地则还有很长的路要走。用他的话说:“按照现在的趋势来看,在软件、互联网层面,人工智能的影响会发展地非常快,但就机器人、无人驾驶等涉及实体产品的领域,发展速度则会相对较慢,因为产业链长而复杂”。
同时,现在有越来越多的科学家和学者开始人工智能领域的创业,对整个人工智能的产学结合会产生很大影响。戴文渊认为,最后创业成功的跨界科学家,他们不仅能够及时紧跟科学理论的前沿发展,而且还能靠近当代商业,具备敏锐洞察力,推动AI技术高速发展。
对于百老汇,戴文渊直言,虽然离开百度很久,但一直注重与同为百度出身的各界人士的交往和沟通,之后也加入了百老汇创业群,参加过百老汇2016年年会。戴文渊说道:“百老汇的价值是,它是一种情感维系。大家在一起聊起以前做过的事情,是一件很好玩,很开心的事情。”
高级大数据研发工程师
职位描述:
设计、开发、优化机器学习场景下的工作流引擎、通用数据处理框架和通用计算组件;
探索、设计、开发机器学习场景下高效稳定的大数据并行处理算法 ;
探索、调研、开发人工智能应用中的相关数据技术,丰富产品功能;
任职要求:
3+年的大数据系统或后端研发经验;扎实的算法和数据结构功底,熟练掌握Java、Scala、C++中至少一门编程语言;
掌握分布式系统原理,掌握Hadoop相关技术,熟悉主流框架(如MapReduce,Spark),并有2年+的Hadoop开发经验;
具备一定的系统设计能力,主持或参与设计过大数据业务系统架构,并成功发布/上线;
参与过系统底层优化项目或编译器后端优化项目者优先;
具有开源项目贡献者,尤其是Hadoop或编译器相关项目优先;
具有ACM-ICPC等程序设计竞赛参赛、获奖经历者优先。
工作地点:北京
职位描述:
任职要求:
“百英”人物报道针对百老汇的成员,目前已经进行到第十六期了。百英采访目前非常受关注,几乎每一期都会有同学要求被采访。我们是无条件不收费的免费报道,无论你现在是创业、做投资、上班,还是在家休息,都可以成为我们的报道对象。我们会对大家进行面对面的采访,然后整理成文,最后集结成册,跟大家一起分享你在百度和百老汇的故事。如果你希望被我们报道,请跟百老汇小秘书联系。
同时,我们在百老汇同学中“征集”有过记者或文案经验的撰稿人,希望你能和我们一起完成这项看来很平常,但有可能伟大的事业。感兴趣的同学加百老汇小秘书微信,也欢迎大家向我们提出宝贵意见,小秘书微信(b20150910)。
往期“百英访谈”精彩报道回顾 ↓↓↓
第十六期——蔡沁宇:作为核心产品经理他见证了网盘大战和百度网盘的成功,创业做金融科技公司,却为何会首先考虑社会责任?