专栏名称: AI开发者
AI研习社,雷锋网旗下关注AI开发技巧及技术教程订阅号。
目录
相关文章推荐
AIbase基地  ·  最好的 Manus 复刻项目?GAIA ... ·  17 小时前  
AIbase基地  ·  最好的 Manus 复刻项目?GAIA ... ·  17 小时前  
爱可可-爱生活  ·  恭喜@-_-BUG-_- ... ·  2 天前  
AIGC开放社区  ·  AI紧箍咒!OpenAI发布CoT监控,阻止 ... ·  2 天前  
AIGC开放社区  ·  AI紧箍咒!OpenAI发布CoT监控,阻止 ... ·  2 天前  
宝玉xp  ·  回复@Timetopretenddd:这我还 ... ·  3 天前  
51好读  ›  专栏  ›  AI开发者

小米崔宝秋:开源是软件的未来

AI开发者  · 公众号  · AI  · 2020-03-01 20:40

正文






“AI 开发者”即日起全新升级为“ AI 源创评论 ”,在延续开发者、开源、赛事报道的基础上,增加技术人物栏目“AI 源创 100”、企业开源&技术实力数据库“AI 源创因子”、开发者线下峰会“AI 源创会”,为开发者、企业带来更全面、深入的信息、技术服务。本文为“AI 源创 100”的第一篇。



一位开源信徒的信仰和践行。

文 | 张梦华


“小米是 Daniel 最中意的选择”

2019 年 11 月的第一个周末,小米集团副总裁、集团技术委员会主席崔宝秋收到 Daniel 从西雅图打来的电话,后者表达了有朋友想基于 Kaldi 成立创业公司,并希望邀请自己做顾问的想法,他问崔宝秋:小米和你是否介意?

基于开源大方向的私营公司不乏成功的先例, Redhat 便是典范之一。崔宝秋在电话里给予了方向上的肯定,并表达了自己希望“四赢”的愿望:Kaldi 项目和 Daniel 要“happy”;小米要“happy”;基于 Kaldi 相关的创业公司要“happy”;Kaldi 社区的全球用户也要“happy”。此时,Daniel 即将入职小米,为了争取这位语音技术专家的加入,崔宝秋在过去两个月把大量精力都投入到了争取 Daniel 的工作中。

在语音识别技术领域,Daniel Povey 的名字几乎无人不晓,他是著名语音识别开源工具 Kaldi 的创始者和主要维护者,论文被引用超过 2 万次。2019 年 6 月,因被动介入学生抗议活动,在约翰·霍普金斯大学任副教授的 Daniel 被校方解雇。之后,其动向就一直备受学界和业界关注。

8 月中旬,Daniel 表示将可能选择一家中国企业或高校作为职业生涯的下一站。他与清华、北大等院校保持着深入接触,更有消息传出,Daniel 已经提前收到了某位副校长的 offer。国内头部互联网公司如美团、滴滴、快手等更是蜂拥而上,希望将这位世界首屈一指的语音识别专家招致麾下,近两年以小爱同学作为 AIoT 战略核心的小米自然也在积极争取的队列中。

小米人力资源团队和语音团队同时收到崔宝秋的指示:“竭尽全力把 Daniel 吸引过来”——最不济也要把他变成小米的技术顾问。从最开始与 Daniel 接触,崔宝秋便亲自统筹了负责接洽的人力资源团队,并直接与Daniel 的中国猎头 Joy 沟通,希望通过后者传达小米的能力与诚意。“和中国公司一起打造健康的社区,走向世界。”这是崔宝秋一直向 Daniel 重点表达的开源愿景。

Daniel 在小米

8 月下旬,崔宝秋第一次拨通西雅图的电话。稍早一些时候,两人有过简单的邮件沟通,在收到小米的基础信息并感受到其诚意后,Daniel 便主动提出希望通过电话更深入地讨论。

事实上,两人此前曾有过一段职业经历的重合——2003 年到 2006 年,崔宝秋和 Daniel 都曾在 IBM 任职,但因分属不同部门而没有工作交集。在这通午夜电话里,崔宝秋向 Daniel 介绍了小米,而后便是自己从 2012 年加入小米不久就一直力推的开源战略,听到 Daniel 9月初将在中国停留两个星期的计划后,崔宝秋又马上向其发出了参观小米公司的邀请。电话里,一贯语速较快的崔宝秋因为求贤若渴显得过于兴奋,一股脑儿只想在短时间内把小米的商业模式和技术战略都告诉Daniel,以至于接下来几天一直担心对方是否会被自己过度的热情吓退。

本来,清华、北大是 Daniel 在中国的前两站,但抵京的第二天,原定的行程突然更改,Daniel 最先出现在了西二旗的小米新园区。小米集团技术委员会也给予了最高规格的欢迎礼仪:集团副总裁兼集团技术委员会主席崔宝秋、人工智能部总经理叶航军、NLP 首席科学家王斌、语音技术总监王育军,再到各部门工程师,依次向 Daniel 介绍了小米的“手机+AIoT”双引擎战略和生态、公司的开源工程、AI 实验室、以小爱同学为中心的语音技术。

小米集团技术委员会

Daniel 的到访给了崔宝秋更多信心。但这之后,他一路南下,在上海、深圳陆续拜访了多个高校和互联网企业,行程中不免出现变数。9 月 9 号,Joy 打来的一通关于 Daniel 很可能将转投上海交大的电话便是其中的反映。

Joy 当时告诉崔宝秋,Daniel 对高校工作更感兴趣,崔宝秋听完不免灰心,但仍不愿放弃做最后的争取,他又在第一时间通过 Joy 给 Daniel 发去自己过去几年对外讲过的 3 份小米开源英文 PPT 和 3 篇外媒报道,并告诉 Daniel,小米希望和他一起把中国的开源力量推向世界。

9 月 11 日早上,崔宝秋便给 Daniel 打去了电话,意料之外的,电话接通没几分钟,Daniel 便坦承,小米已经是自己的“top choice”。国内高校程序相对繁琐,互联网公司对优秀工程师明显有着更强的吸引力,而这之中小米在开源上的努力与成绩又尤为突出,更重要的是,管理小米工程师团队又一直把开源作为战略核心的崔宝秋对公司的开源策略有直接决策权,可为 Daniel 提供更有力的工作支持。

Daniel 提出,自己不需要所谓的百万美金合同。离开约翰·霍普金斯大学之初,Facebook 曾是 Daniel 最早的可能性,前者给出的“百万美金合同”也成为媒体口径中与 Daniel 联系最紧密的标签之一,但这显然并不占据 Daniel 的主要决策因素。

Daniel 在电话里明确,百万美金的薪酬不是他所看重的,其更多强调的是自己对于 Kaldi 和开源的愿景。

崔宝秋在电话中向 Daniel 细数小米的生态、语音的战略地位、小米的工程师团队,小米过去以及之后如何推进开源、Daniel 的工作环境将如何保证、Kaldi 将被给予怎样的成长空间,都一一有了详尽的规划与步骤,40 多分钟的电话最后落在一句有力的承诺上:“Kaldi 在小米有着广泛的应用,非常重要,我有勇气和信心,可以为你保证一个完美的环境。”

接下来几天,在 Daniel 在深圳、以色列、欧洲的行程中辗转时,小米向 Daniel 发出了 offer——offer 的最后修改仍由崔宝秋直接参与。11 月 18 日,雷军正式在微博宣布 Daniel 加入小米。

崔宝秋和 Daniel 在小米新园区

原金山 CEO 张宏江非常赞赏小米争取 Daniel 的举措,但同时也向崔宝秋坦率表达了自己的忧虑:“要小心,他可能待不长”——技术大牛加入互联网公司,继而出现水土不服,草草收场的先例并不少见。

崔宝秋的态度却颇为笃定:“我有信心,基于我们对开源的理解和坚持。”而即便如很多人所说,要常常“做最坏的打算”,崔宝秋对小米通过开源形成的工程师文化与人才机制也有足够的信心:“只要水是干净的、清澈的,小米会吸引到全球最顶级的人才进来。”

站在巨人的肩膀上,并为巨人指方向

与 Daniel 的合同敲定后,Joy 向崔宝秋总结,在众多条件中,开源战略是为小米赢得 Daniel 的重要砝码之一。而对开源的解释与强调并不仅仅是崔宝秋争取人才的策略性行为,从加入小米之初,崔宝秋便一直在小米力推开源战略。

2012 年,小米有四个支柱业务:手机、MIUI、米聊、电商,缺一个互联网公司必备的技术工程部与运维部。循着硅谷的路径,崔宝秋加入小米的第一件事便是主导成立了小米云平台,开源是最早的建设工具,并随之有了开源战略。

核心团队里有过不同意见,小米要不要全开源,MIUI 要不要开源,都是在内部重点讨论过的问题。崔宝秋坚持,最早的云平台只有几十人,不开源生产力跟不上,不用 Hadoop 也不现实,况且 Facebook、雅虎在这个路径上已经有过成功的验证。

雷军在 2019 小米开发者大会上


这些建议得到了雷军的力挺。“任何一个创业公司,不开源就直接输在起跑线上。”雷军的结论来自安卓的启发。雷军讲起过创办小米的四个主要原因:中国的制造能力提升,富士康能为苹果做 iPhone,也可以为小米做手机;中国人的消费水平提高;功能机向智能机升级;最后的关键点,就是安卓的开源。

从最初的爱好者,到社区贡献者、管理者,崔宝秋对开源的利好感受颇深:吸引人才,帮助提高软件质量,最重要的是可以降低公司的软件开发、维护成本。从企业的角度讲,开源是“用最小的代价获取最大的利益。”

在美国求学期间,崔宝秋便深受开源运动的感召,他是 Linux 的狂热爱好者,毕业后,他在 IBM 做高级工程师,负责 DB2 数据库优化和内核等核心模块的研发;崔宝秋 2006 年加入雅虎时,正逢 Hadoop 成立,后者和其所在的搜索引擎团队合作紧密,使得他在对开源的利用上更加如鱼得水;加入LinkedIn 后,崔宝秋又参与开源了分布式实时搜索系统 SenseiDB。从开源的爱好者、管理者到推动者,开源一直是他技术生涯的关键词。

如他所说,开源也许并非改变世界的重器,但可以做一枚皇冠上的钻石。直到今天他仍认为,百度和谷歌在移动互联网时代拉开差距的关键点,不是技术、团队或者 AI,而是安卓。

简单描绘小米的开源战略,其一是“快”:先爬上巨人的肩膀,才能跟着一起走。事实上,“快”也是雷军对产品、技术迭代的一贯要求。快速选型,快速定位,快速掌握,快速占领市场,这是崔宝秋强调的开源第一原则。2012 年,他带领核心工程师快速选型 HBase 之后,便很快组建了小米 HBase 团队。

先于隐私委员会和大数据委员会,开源委员会是崔宝秋在小米主导成立的第一个委员会。云、大数据、人工智能,崔宝秋在小米推动的“CBA”(云计算-大数据-人工智能技术)路线,每一条路线,开源都是不可或缺的工具。

“不重复造轮子”是崔宝秋总结的第二条前车之鉴。

过去参与开源的 20 多年,在学校、企业、社区,崔宝秋见过太多重复造轮子的案例,很多工程师看不上已有的东西,上来只想做新的来自证实力,但最后往往发现不如所想。很多企业在开源上无法走远,不间断地重造轮子是重要弊病。

“你在开源圈里想到的所有东西,基本上别人都已经做到了,所以绝不要自认为牛,先写一个东西。你写的东西一般都是小儿科。” 崔宝秋说。到了小米,“所有的坑从第一天就不允许它发生。”

雷军(左)和 Daniel

不用则已,要用则精是其三。

从 2014 年开始,崔宝秋频繁出现在业界会议上为开源呼吁,也常和很多一线管理者有观点碰撞。王坚谈起这个话题,抛出疑问:开源虽好,但就阿里云而言,还是太不保险。“如果社区出现补丁,部署到线上,谁敢按 OK 键?”王坚很认真地向崔宝秋发问。

王坚不是第一个表达这种忧虑的人,崔宝秋说,所以要坚持:不用则已,要用则精。“要用你真正驾驭的,真正掌握的,不能驾驭它等于没用。”代码要精,要老练,抓住了这一点,也就消除了保险与否的疑虑。

坚持开放与共享是其四。

崔宝秋博士时期便痴迷 Emacs ,“上厕所都玩Emacs”。开源的 Emacs 让他能对代码做各种改动,有段时间,他沉迷于改代码,玩得很嗨,工程师的成就感前所未有地得到满足,但因为用完没有及时贡献回去,不久后,Emacs 社区突然刷新,文件和架构全部调整,最后他为了修改老版本的代码耗了不少功夫。

他也见过不少大公司的工程师,使用 Hadoop 后在本地版本上修改,没有回报到社区,最后本地版本和社区版本完全脱节,逐渐枯竭,公司根本无从享受开源的长期利好。

开放与共享是最知易行难。写注释、改代码是繁琐的劳动,复现和注释的时间可能超过写代码本身,前期的一个改进只需几周,为了证明这一改进则要耗费几个月,得“自己拽着自己”,很多巨头的开源项目陷在这个环节。

2014 年,崔宝秋与硅谷一位知名互联网公司的开源负责人交流,说起小米在 HBase 上遇到并解决的几个技术问题,几轮对话中,对方一直频频点头感慨:“我们也碰到了这个问题。”崔宝秋听后表示:“你们碰到问题并解决了,但没有回馈给社区,太可惜了。”当时他正带着团队的几个工程师解决社区里接二连三的问题,并把多个解决方案回馈给社区。

在重大项目上极力推出自己的 Committer 是其五。

在崔宝秋的定义里,开源贡献者分三种:个人爱好者,有开源商业模式的组织和无开源商业模式的组织。有开源商业模式组织如华为、IBM 等公司,其诉求是通过开源形成底层软硬件、应用层、云服务的解决方案。小米则属于最后一种,对开源没有直接变现需求,而是希望利用其支撑互联网服务,如小爱同学、云服务、浏览器、社交、游戏。这与谷歌、雅虎、Facebook、Twitter、LinkedIn 等硅谷公司的态度一致。

“公司不在大小,打法才是关键,重要的是融入社区。”这听起来没有太多神秘可言,但真正理解开源,参与过、贡献过的人,才更能摸清其中的门道和沟坎。开源是巨人,站在巨人的肩膀上是第一步,更重要的是,要为巨人指方向,赢得社区话语权,推出自己的 Committer 便是其中的关键。社区 Committer 拥有审核代码的权力,可以直接影响代码和系统的演进方向,为企业自身争取利益。






请到「今天看啥」查看全文