极客公园微信号:geekpark
工程师文化
本文来自酷壳 CoolShell.cn,作者为陈皓,亚马逊中国研发经理,酷壳(CoolShell.cn)博主,亚马逊中国研发经理。14 年软件开发相关工作经验,8 年以上项目和团队管理经验,原标题《什么是工程师文化》。正文中所有提及文章的链接都可以点击「阅读原文」获得。
四年前,我在 QCon 上演讲了一个《建一支强大的小团队》(整理的 PPT 分享可后台回复「资源」获得)提到了工程师文化。今天,我想在这里再写一篇关于工程师文化的文章,一方面是因为我又有了一些想法和体会,另一方面,因为我也正走在创业的道路。毫无疑问,要建一个有浓重的工程师文化的团队或公司,所以有必要把自己的有关想法留下成为白底黑字的「字据」,以供打自己的脸。
——「要是未来没有做到,这篇文章就打我未来的脸」,「这篇文章太幼稚了,未来的我会打我现在的脸」,我希望是前者。
Again,这篇文章不是招人的贴子。因为我觉得,招聘第一重要的事,不是发招聘广告或是找猎头挖人,而是先得让自己变成一个能配得上真正工程师的公司,然后再谈吸引人的事。
为什么要工程师文化
看看最近二十年来社会的发展,计算机和互联网已经渗透到了这个社会的每一个角落,各式各样的计算机技术成为了整个世界发展的强大引擎,各式各样的创新,无论是业务创新还是技术创新,都是依托于技术的快速演进,技术成了解放生产力提高社会运作的效率的中坚力量。以美帝国主义为首的技术创新公司着着实实地改变着这个世界和人类的生活和生产习惯。
今天,每个从事计算机行业的技术人员都应该感到幸运,因为,我们不但选对了行业,也出生在了正确的时代,可以感受到前所未有的刺激和变化。相比起我们的父辈而言,我们的人生能经历这样的时代,实在是一种幸运。所以,选对了职业并出生在了正确的年代的我们,只是需要思考的一个问题就是:我是否呆在了正确的地方?
在我看来,这个世界上有三种商业公司:
· 运营或销售驱动型的公司。这类的公司以运营和营销见长,技术对于他们来说,更多的只是为了支持大规模的营销活动,以及成本上的控制,所以,基本上来说不需要技术创新。这种公司最大的问题就是缺乏安全感。
· 产品驱动型的公司。这类公司以产品见长,通过创造能提升用户生活体验的产品见长,技术对于他们来说,除了支持大规模的在线用户之外,他们会更多地去寻找那些为了增强用户体验,提高整个业务流程效率的技术创新。比如:UI 的交互方面的,整个业务流程方面的。这种公司最大的问题,就是容易被别人模仿和抄袭。
· 技术驱动型的公司。这类的公司相信技术能改变世界,他们更多的是用强大的工程技术来创造具有颠覆性的东西,更多的是用各种自动化的技术取代人类。比如:近代的蒸汽机技术取代了大量的人工,数字技术取代了大量信息传递的人工,现在这类公司还希望通过人工智能取代愚蠢的人类来做决定。这种公司最大的问题就是可能做出叫好却不叫座的东西。
这三种公司都可能成功,也都有问题。但是,无一例外,他们都需要强大的技术支撑,只不过,他们把技术所放在的位置不一样。
无论你有多么看不起技术人员,你都无法否认,你今天的生活相当地依赖这帮工程师,没有他们,你恐怕都不知道怎么生活了。邓爷爷几十年前就说过——「科学技术是第一生产力」无论什么样的科学技术的理论要落地都会依赖于工程技术有多先进。
所以,在今天,作为一个 IT 公司或互联网公司,「工程师文化」不是一个问题,而是一个常识!
工程师文化的特征
我下面罗列的这些特征来源于,Google 的《重新定义公司》,我本人在 Amazon 的经历,37Signals 的《Rework》,Quora 上的 What Makes Good Engineering Culture? 以及 Slideshare 上的 What Makes Good Engineering Culture,还包括我最近这半年来的一些实践。
对我来说,我可以简单地把这么多的工程师文化总结成两大类:「自由」和「效率」。
本来还应该有个「创新」,但我个人认为,创新的前提是——在自由的环境下对提高效率的痴迷,就一定会发生创新。
创新不是凭空出现新的东西。
其实,观察一下人类的发展史,不难发现,几乎所有的创新基本上都跳出了原来的思维模式,转而用新的思维模式去对原有问题的效率进行质的提升。比如:通信、交通、医疗、教育、生活……几乎全都是在优化效率。
所以,如果你的精神不自由,你很难跳出老旧的思维模式,你用老旧的思维模式,很难能够想到新的方法和方式,如果不是对效率的提升,这个创新可能会不接地气。
「自由」
首先,工程师文化意味着创新文化,工程师都是有创新冲动的人,因为手里有创造技能的人通常都想创造点什么。而创新的源泉来源于精神的解放,精神自由才会引发各式各样的奇思怪想,才会有常人视作不可能的疯狂想法和想像力,而这些想法和想像力导致了创新。
精神上的自由具体表现在:
· 自我驱动。自己管理自己是最好的管理。最失败的管理就是家长和保姆式的管理。由兴趣出发的工作才可能迸发出真正的动力。
· 灵活的工作时间和地点。工程师们更多的是脑力工作,而不是体力工作,工作上时间和地点的自由安排可以让工程师们的脑力工作更有效。Remote 是一个很不错的工作方式,开源社区基本上都是这钟方式。和 Remote 有关的话题可参看《Remote》这本书。
· 信息平等。这意味着,全体员工得到的是原始信息,而不是被管理者们层层加工消化后的信息。从大的来看包括战略、方向、目标、财务,小的包括文档、代码、和知识的共享等等。同样,信息平等也表现在意见表达上,任何人都拥有表达自己的意见和建议的平等机会,这样才会激发出更多的思路和思辩,从而有不同的或许更好的思路出现。而不是大家都看到了问题,而没有人敢说。在 Google 除了代码全员共享,还有 Thanks God. It's Friday 的文化,即每周五高管们会出来,任员工提各种尖锐的问题;在 Amazon,代码和文档基本上全员开放,包括财务报表也对员工开放,另外,除了所有的 NB 的 Principle SDE 隔三岔五都会有一个 Principle Talk,有很多 Talk 相当令人开脑洞,还有 Amazon 内部的 Up the River 文化,每年会选出一批公司最聪明最有想法的人集会,思考讨论公司下一步的计划和战略,并可以把相应的 KPI 直接按给 Senior VP。
· 不害怕错误。针对如何处理错误,正确的姿势应该是分析总结教训,而不是惩罚故障人。前者让人改善进步,后者让人萎缩不前。最大的错误就是不敢犯错,最大的问题就是不敢直面问题。
· 宽松的审批系统甚至没有审批系统。审批通常暗示着三件事,1)对人的不完全信任,2)繁琐的流程,3)思维上的束服。这些都是创新和想像力的天敌。一个公司的监管、审批的流程越重,这个公司的活力也就越差。
· 20%的自由时间。这是 Google 公司提出来的,员工有 20%自由的时间做自己想做的项目,Gmail 就是这么出来的。
「效率」
工程师天生是追求效率的。有人说认为程序员花大量的时间做自动化的工具,还不如人肉运作的效率高。他举例子,写自动化的脚本花 5 个小时,而重复做这件事 200 次只花 3 个小时。有这样理解的人根本不懂工程。
一方面,这个工具可以共享重用,更多的人可以从中受益,而不是微观上的比较。更重要的是,这是一种文化,一种提高效率的文化,他会鼓励更多的这样的事情发生。如果你因为一个程序员花大量的时间开发自动化的工具,而认为这个程序员没有效率,对之批评甚至惩罚的话,那么你就扼杀了提高效率的文化。(关于效率,大家可以看看我的另一篇文章《关于加班和效率》,你会真正了解什么是效率)
人类之所以比别的动物聪明就是会使用和发明工具。而古语也有云:「工欲善其事,必先利其器。」看看美军的装备你就知道战争工具的好坏有多重要了,一个公司的强大之处在执行力,而执行力的强大之处在于你有什么样的支持工具。这些,已经不是工程师文化,而是人类发展的文化。
针对于工程师文化来说,尤其是软件工程,提升工程效率的具体表现如下:
· 简化。简化不是简陋,简单的东西通常意味着用户能够更好理解,也意味着更容易地维护和运营。就像阿里推行的「小而美」,就像乔布期推崇的「没有产品手册的简单易用的产品」,就像 Amazon 推行的 Working Backwards 里说的那样:一个新的产品或功能,产品经理需要写三个文档,包括媒体公关文、用户手册和常见问题,三个文档不允许超过两页 A4 纸,且不允许用任何图片说明。
· 残酷无情地推行自动化。编写程序的最本质的东西就是自动化,看看人类发展史上自动化了多少东西。对于自动化来说,不仅仅只是消除人肉的重复劳动,更重要的是,很多事情人完全干不过机器,比如架设一台机器,程序在秒级就可以完成,人是永远不可能达到这样的速度的。自动化需要大力开发提高生产力的工具,比如:持续集成,持续部署,自动化运维,基础自动化运维,甚至自动化的运营工具。Amazon 的软件工程中对自动化和简化相当迷恋。
· 避免无效率的组织架构和无效率的管理。这体现在如下方面:1)扁平化的组织架构,2)努力用自动化工具取代支持型的工作,3)不超过 10 个人的全栈小团队,4)不按人员的技能分工而是按其负责的产品或功能分工(关于分工,请参看《让我们来谈谈分工》),5)通过产品的目标或信条 Tenets 来减少沟通和决策过程。Amazon 里的每个部门,每个团队,每个产品都有自己的 Tenets,这个 Tenets 标明了要什么不要什么,比如 AWS 的几个信条:运维是最高优级的——这意味着只要是会让运维变得复杂的需求都可能会工程团队被拒掉,Throughput & Laentcy 不能更差——这意味着,功能要为性能让路,因为性能变差了,用户就要买更多的资源。
· 正确的组件抽象。抽象是简化的一部份,一方面,抽象意味着重用和通用,另一方面抽象意味着强大的扩展性,以适配各种可能性。最重要的是,抽象意味着技术能力的输出,无论是内部的其他团队还是外部的团队。比如:Google 的 MapReduce/BigTable,FaceBook 的 Thrift,还有 Amazon 内部的 WebService 框架 Coral Service、处理日志监控的 Timber,以及全线 AWS 产品都用到的 Amazon Lock Framework(一个分布式锁框架)……
· 开发高质量的产品。因为高质量的代码,不但可以易于修改和维护,还可以因为减少处理线上故障的次数,从而有更多的时间去为未来做更多创造性的工作。这意味着需要有非常严谨的 Design Review,Code Review,以及测试。(关于 Code Review 可以参看文章《从 Code Review 谈如何做技术》,关于严谨的测试可以参看文章《如何做性能测试》)
· 不断地提高标准以及招聘最好的人。取法其上,得乎其中,取法其中,得乎其下,取法其下,法不得也。如果一个公司或一个团队想变得越来越好,越来越强大的话,就必需要不断提高自己的工作标准,提高工作标准意味着要不断地招聘最好的人。在 Amazon 和 Google 的招聘官中都有一个叫 Bar Rasier 的人,这个人就是为了提高招聘标准而设立的。
· 创建一个持续改善的文化。一个好的组织,一个好的团队,是需要不断反思前进的,这需要全体员工一起来的。微观层面上,在项目做完后需要有一个总结会分析项目中的得失,在故障出现后,需要有故障分析会,反思得失,在 Amazon,严重的故障,需要写一个 COE(Correction of Errors)的文档,其中有一节叫「Ask 5 Whys」,让你自己问自己至少 5 个为什么。在宏观层面,一个公司每年都应该做一定的工作数据分析或是员工调查,比如是否招聘到了不错的人、工作的投入产出比、员工在哪些地方花时间了等等,然后不断用技术手段来改善。Amazon 每年的工程师员工调查表是我长那么大见过的最详尽细致的调查表了,问题除了对公司、经理、文化,还有从日常工作、开发环境、持续集成、测试自动化、产品质量、软件架构、软件维护、线上问题处理、年度计划、数据仓库建设、通用工具投票……这份员工调查直接导致公司的对工程的投资方向。
工程师文化如何落地
如果你要让任何文化在公司内得到执行,你有下面几个手段可以选择:
· 通过政治手段:你需要把三个地方——招聘、绩效考核和升职路径。比如,你要落地工程师文化中的简化和自动化,那你在招聘的时候就需要把懂简化和喜欢自动化的人招进来,然后在绩效考核和升职的地方设置一条硬性指标——你今年简化了什么?自动化了什么?如果没有,对不起不但不能升职,绩效可能还不达标。
· 通过经济手段:让不做这事的成本 > 要做这个的成本。然后,正常的人类都会选择成本低的方案。比如,如果你要推行 Design/Code Review/UT 以提高质量,你就把 QA 和 OPS 团队全挪到一边去,让 Dev 团队自己测试,自己负责,而 QA 和 OPS 团队只是帮你做工具罢了,而测试和运维的事全是你 DEV 的 Ownership,出了故障也是 Dev 自己负责。于是,他们就会发现,不做 Code Review 和 UT 的成本远远大于做 Code Review 和 UT 的成本,他们就会去做的。
最后,工程师文化要落地,还有几个小条件:
第一,团队要小,Ownership 很重要,Eat Your Own Dog Food。没有人帮你擦屁股,自己的屎自己吃,没有痛苦,就不会产生想进步的动力。
第二,热爱学习和尝试。学习尝试新的技术,开拓眼界,学习尝试新的思维方式,否则呆在原地的话,原有的思维方式只会让你在原地打转转。
第三,老板更多的相信技术而不是管理。相信技术会用技术来解决问题,相信管理,那就只会有制度、流程和价值观来解决问题。
其它
说了这么多,时代还在发展,不过,这是我这么多年经历或看到的工程师文化的东西了。最后吐几个槽——
对于 996 和加班这事,对于工程师来说从来都不是问题,在解决技术问题或是创造的时候,工程师是个很自觉的群体,基本不需要有别人驱动,工程师是最乐意 Work Hard 的人了。我相信几乎所有走上编程这个职业的人来说,基本上都是兴趣所至,觉得编程很有趣,但却被各个公司 996 搞得对编程流失兴趣。
为什么?你们这些公司非得要向中国教育学习,人家本来对这事有比较高的兴趣的,但就是要通过考试/KPI/996 这些东西把人家的兴趣一点一点磨灭掉,把人变成机器、奴隶、牲口,让人对学习和工作产生了厌倦和讨厌,会是你们这些管理者们所希望的?是不是只有把人变得不思进取了,你们才会管理?就像《软件开发中的两种管理方式》中说的第一种人一样?
另外,我不知道,为什么我一说这些东西,就会有很多人,包括程序员自己来跟我说我是个理想主义者,这些已经不是什么理想了,已被很多成功的公司用了很多很多年了。只是你没有见到过罢了。还有的人说,因为中国的国情不同。这更让我费解了。这让我想到了当年大清朝派了一堆人出国考察后回来后,说外国的那套共和的东西不符合中国国情,最终也在历史的潮流中被淹没掉了。另外,什么叫「中国的国情不同」?中国有全世界数一数二的互联网用户,也有全世界数一数二的市场,不再是以前那个一穷二白的年代了,中国的国情到底有哪些不同呢?
我不知道各位工程师是为什么活的?但我觉得,我们选择了一个刺激的职业,也赶上了这个行业大发展的时代。我们不妨扪心自问一下,你是否愿意让自己的能力、青春和热情就这样被磨灭了?
(头图购自华盖创意)