专栏名称: 百老汇
百老汇是百度离职员工之家的昵称。我们会定期组织活动,包括并不限于招聘求职、投融资、相亲交友、商务合作、老同事交流… …欢迎我厂前同事加入。
目录
相关文章推荐
白鲸出海  ·  短剧暴涨,但还是“小透明”? ·  昨天  
阿里开发者  ·  【提效】docker镜像构建优化-提速10倍 ·  昨天  
白鲸出海  ·  Product ... ·  1 周前  
51好读  ›  专栏  ›  百老汇

他曾是百度最年轻的科学家 三年从T8升到T10 如今他想让人工智能服务所有人

百老汇  · 公众号  · 科技公司  · 2017-08-17 11:05

正文

文|汤倩


戴文渊——第四范式CEO

戴文渊,大学时带领三人团队夺得ACM世界冠军和三个亚洲冠军;曾是百度最年轻的高级科学家,三年从T8升到T10。现在,作为人工智能领域的代表,他和他创立的第四范式正在成为整个行业的标杆。

机器学习领域的技术天才

     2005年,在上海举行的ACM中,戴文渊所在的上海交通大学代表中国队参赛。作为历史最悠久、规模最大、级别最高的的国际大学生程序设计竞赛,ACM素来被冠以"程序设计的奥林匹克"之称。在那年的比赛中,戴文渊和他的三人小组在五个小时内完成了十道题中的八道,以高出第二名整整一道题的成绩获得世界冠军。

     随后,戴文渊在交大继续硕士和博士连读的学生生涯,并指导学弟学妹多次拿到ACM的亚洲冠军。同时,他在人工智能的研究领域也是颇有建树,学术论文多次被NIPS, ICML, AAAI, KDD等国际顶级学术会议收录。 

     随着互联网的飞速发展和数据量的增加,戴文渊认为人工智能落地的时机正在慢慢来到,AI有可能从实验室实现产业落地,于是他决定找些企业聊聊自己的想法。在机缘巧合之下,戴文渊接触到了当时百度凤巢的负责人,因为相同的理想和情怀,2009年5月,戴文渊决定正式加入百度凤巢。入职时,他的title以是高级工程师,而在试用期过后,就破例升至T8级别。对于年轻的戴文渊而言,T8级别不仅体现了百度对于戴文渊在AI领域的发现和创新的肯定,也意味着百度对其未来所能创造价值的深切厚望。

三年升到T10的技术大神

     2009年,百度凤巢已经推出了一段时间,虽然整个凤巢的收入还在稳步增长,但在技术上却遭遇了瓶颈,效率很难得到提高。为了寻找和开拓新的收入增长点,凤巢组建了数个小团队,包括博弈论小组,大数据小组,以及戴文渊的AI小组等。最终,由戴文渊与几位实习生组成的AI小组取得了巨大的成绩,并最终把其他几组人才吸引过来。 

     对百度来说,过去的广告投放流程是专家制定策略,形成规则。尽管当时百度已经有约一万条规则,但这个数量对百度的搜索数据而言还是很小的。戴文渊利用机器学习技术,让机器在很短的时间里轻松写到一千万条策略,在制定更精细广告投放规则的同时,相对人工的效率提升了一千倍,带来的收入较以往平均水平提升了40%。

     在随后几年时间内,戴文渊一直专注于通过开发机器制定规则。到2013年,百度凤巢已经拥有一千亿条规则,而他也已经是一位带领数百名研发人员的T10科学家,在百度内部被称为“戴神”。但是,在入职百度满四年时,他选择了离开。因为戴文渊认为自己身上的标签应该是人工智能,而非广告。当时在百度,他只能把人工智能落地化到广告这一个场景,而他想把人工智能的福利带给更多人。 

AI for everyone,提供人工智能服务

     从百度离职后,戴文渊去了香港,加盟华为,担任诺亚方舟实验室主任科学家,做TOB的企业服务,尝试用企业服务的方式做AI,把华为大数据产品提供给客户。“我当时的工作性质有点类似于售前工程师,把产品的价值传递给客户,在专业人士和普通人士之间建立一座桥梁,将产品转变成普通人可以理解的模式。 

     2014年,戴文渊离开华为,次年便和机器学习领域的顶尖科学家、资深工程师、金融和咨询专家一起,创立了行业领先的人工智能技术与服务提供企业——第四范式,并担任CEO。

     戴文渊说道,“第四范式这个词最早是在2005年提出来的,即用机器和数据写规则。在“第四范式”之前还有:第一范式原始人记录自然现象,钻木取火下次重复;第二范式理论科学,总结出规律,后人知道规律就可以,比如牛顿物理学等;第三范式计算机推演,做的更复杂,比如核试验,天气预报等。所以,我们第四范式就是致力于要让机器干牛顿的事,看到数据总结规律”。

     第四范式秉持“AI for everyone”的理念,基于应用场景开发出显著提升竞争力的行业解决方案。 戴文渊认为这个业务发展将经历三个阶段:第一个阶段将算法作为“屠龙刀”,即打造平台,开发产品和服务;第二个阶段“摘叶飞花皆可伤人”,即应用阶段,不拘泥某种具体算法,即使很low的算法也能玩出很棒的花样,比如帮助企业进行决策,是否投放一条广告、要不要向市场推出一种产品;第三个阶段“无招胜有招”,平台会分层,找最合适的技术,自行造出一把新的“屠龙刀”。 

     “我们正在尝试用AI改变很多行业的传统工作方法”,戴文渊说,“以金融行业为例,AI可以成为最好的风控专家,银行现有的反欺诈专家系统无法与AI媲美。近期,我们为一家大型银行设计和上线了反欺诈模型。我们的工程师通过快速理解客户的需求,依靠机器设计和实现目标模型,帮助该行的反欺诈工作效率较以往提升了四倍之多”。

     在第四范式现在的员工中,研发人员占比70%,除了算法科学家之外,还有大量开发工程师在负责产品落地化。为了实现“AI for everyone”,第四范式自主研发出国内首个面向应用者的人工智能开发平台——“先知”,该平台为企业提供快速完成AI转型的便捷方式。基于“先知”,企业工程师甚至是业务人员,能够在1人月内开发出适用于本行业的人工智能应用。“我们就是这样一家很酷的企业”,戴文渊笑道,“我们的愿景是让人工智能触手可及”。

人工智能行业还不到冰山一角

     在戴文渊看来,现在人工智能的应用场景还是冰山一角,距离多领域、多场景的广泛爆发和商业化落地则还有很长的路要走。用他的话说:“按照现在的趋势来看,在软件、互联网层面,人工智能的影响会发展地非常快,但就机器人、无人驾驶等涉及实体产品的领域,发展速度则会相对较慢,因为产业链长而复杂”。

         同时,现在有越来越多的科学家和学者开始人工智能领域的创业,对整个人工智能的产学结合会产生很大影响。戴文渊认为,最后创业成功的跨界科学家,他们不仅能够及时紧跟科学理论的前沿发展,而且还能靠近当代商业,具备敏锐洞察力,推动AI技术高速发展。

百老汇最大的价值在于情感维系

  对于百老汇,戴文渊直言,虽然离开百度很久,但一直注重与同为百度出身的各界人士的交往和沟通,之后也加入了百老汇创业群,参加过百老汇2016年年会。戴文渊说道:“百老汇的价值是,它是一种情感维系。大家在一起聊起以前做过的事情,是一件很好玩,很开心的事情。”

第四范式热招职位

高级大数据研发工程师

职位描述:

  • 设计、开发、优化机器学习场景下的工作流引擎、通用数据处理框架和通用计算组件;

  • 探索、设计、开发机器学习场景下高效稳定的大数据并行处理算法 ;

  • 探索、调研、开发人工智能应用中的相关数据技术,丰富产品功能;

 任职要求

  • 3+年的大数据系统或后端研发经验;扎实的算法和数据结构功底,熟练掌握Java、Scala、C++中至少一门编程语言;

  • 掌握分布式系统原理,掌握Hadoop相关技术,熟悉主流框架(如MapReduce,Spark),并有2年+的Hadoop开发经验;

  • 具备一定的系统设计能力,主持或参与设计过大数据业务系统架构,并成功发布/上线;

  •  参与过系统底层优化项目或编译器后端优化项目者优先;

  • 具有开源项目贡献者,尤其是Hadoop或编译器相关项目优先;

  • 具有ACM-ICPC等程序设计竞赛参赛、获奖经历者优先。

自然语言处理研究员

工作地点:北京

职位描述:

  • 负责大规模非结构化的文本信息挖掘、语义理解相关的研发工作

  • 负责领域知识图谱的构建

  • 负责团队基础NLP工具开发和维护

  • 探索、使用业界最前沿的方法提升现有NLP能力

任职要求

  • 计算机相关专业本科及以上学历

  • 自然语言处理、机器学习、数据挖掘或相关专业

  • 基础扎实,编码过关,熟悉常用的算法和数据结构

  • 熟悉Linux操作系统开发环境,熟悉数据分析

  • 具有海量数据处理经验者优先

  • 加分项:

  • 在自然语言领域国际顶级会议等发表过论文

  • 熟悉中文NLP不同子领域问题及解决方案技术

  • 熟悉End-to-End中文NLP解决方案优先

  • 有过中文NLP、QA、知识图谱方向项目、实践经验者优先

  • 在自然语言领域国际顶级会议等发表过论文

  • 熟悉中文NLP不同子领域问题及解决方案技术

  • 熟悉End-to-End中文NLP解决方案优先

  • 有过中文NLP、QA、知识图谱方向项目、实践经验

百老汇“百英”人物访谈是什么?

     “百英”人物报道针对百老汇的成员,目前已经进行到第十六期了。百英采访目前非常受关注,几乎每一期都会有同学要求被采访。我们是无条件不收费的免费报道,无论你现在是创业、做投资、上班,还是在家休息,都可以成为我们的报道对象。我们会对大家进行面对面的采访,然后整理成文,最后集结成册,跟大家一起分享你在百度和百老汇的故事。如果你希望被我们报道,请跟百老汇小秘书联系。

      同时,我们在百老汇同学中“征集”有过记者或文案经验的撰稿人,希望你能和我们一起完成这项看来很平常,但有可能伟大的事业。感兴趣的同学加百老汇小秘书微信,也欢迎大家向我们提出宝贵意见,小秘书微信(b20150910)。


往期“百英访谈”精彩报道回顾 ↓↓↓

第十六期——蔡沁宇:作为核心产品经理他见证了网盘大战和百度网盘的成功,创业做金融科技公司,却为何会首先考虑社会责任?

 第十五期——莫晓淅:作为十年产品老司机,他做出了一款按秒付息的理财产品,服务中国所有“懒人。”

 第十四期——相国良:他自称互联网行圈最懂房产,红酒行业最懂互联网,但为什么却杀入大健康领域?

 第十三期——唐慕:市场经理出身的他选择做大数据领域创业,2年登陆新三板,现在,他准备去澳大利亚上市