来源:80000Hours
作者:Richard Batty
编译:闻菲
【新智元导读】要不要读机器学习博士?根据美国教育职业咨询网站 80000Hours 的分析,答案是肯定的。如果你适合这份职业,攻读机器学习博士可能是你对社会产生影响力的最佳方式。退一万步说,机器学习博士学位有很大的可能让你获取高薪,而获取高薪后,你不是有机会做很多事情了吗?不论你是否决定读博,这篇文章都有参考价值。
如今,每个人都想学机器学习;近几年来,这已经成了炙手可热的领域。
那么,盛誉之下,机器学习名副其实吗?从某种程度上说,确实如此,机器学习的成功体现了它的实力。
所以,如果你有理工科背景(不一定要学计算机科学专业),想为这个世界做点事情,那么读取机器学习博士学位不失为一个好的选择。机器学习 PhD 能让你拥有使用和塑造这项造福全人类技术的能力。退一万步说,ML 博士证书也能为你敲开许多高薪职位的大门。
接下来,这篇文章将解释为什么机器学习有这么大影响力,你要如何才能学好机器学习,怎么样、去哪里申请相关的博士学位。这个简介中的大部分信息来自与几位机器学习博士的交谈,包括 DeepMind 的研究科学家,一家机器人创业公司的联合创始人(也是计算机视觉博士),以及顶尖大学的博士生。 此外,我们也大量参考了这份计算机科学博士学位的在线指南[1],指南的作者是 CMU 计算机科学系教授 Mor Harchol-Balter,最后更新于 2014 年。
机器学习 PhD 会将你置于一个对全人类发展至关重要的领域。你能用学到的技能对人工智能的发展产生积极影响,使用机器学习技术解决亟待解决的全球性问题。退一万步说,你能挣很多钱,将来捐献给慈善事业。凡是拥有理工科背景的人(本科不一定学计算机)都能读机器学习的博士。
优点
研究潜力巨大
掌握可以说是未来十年最重要的一项技术
毕业后极有可能获得高收入
与有能力的同事进行思维智力交锋
缺点
需要 4-6 年,工资相对较低
需要大量的工作,没有多少反馈,这使许多人失去信心
有泡沫存在的风险,这导致将来更难找到工作
综合评分
职业影响力 ★★★★☆
工作影响力 ★★★★☆
收入水平 ★☆☆☆☆
社会影响力 ★★★☆☆
困难程度 ★☆☆☆☆
岗位满意度 ★★★☆☆
一般而言,我们必须明确告诉计算机要做什么。但是,对于那些很难预先给出确切步骤的任务,这样做就行不通了。相比之下,在机器学习领域,程序员制定软件“学习”的“规则”,也就是算法,而不是直接对软件编程。这意味着我们可以构建能够自动改进体验的系统。
在攻读机器学习博士学位的过程中,你将学习如何设计和实现这些算法。你的博士研究可以涵盖这些课题:创建可以标记视频内容的程序;改进技术,了解机器学习系统如何做出预测;分析在线文本以了解社交行为过程,比如在线俚语如何传播。
你可以查看高校网站(例如斯坦福大学)和以前的论文列表(例如多伦多大学和卡内基梅隆大学的网站),找到更多的研究项目例子。
机器学习是计算机科学的一个子领域,与统计学密切相关。统计学和机器学习的目的是从数据中学习,许多概念和数学工具都是共通的。
但是,与统计学不同,机器学习更注重构建软件进行预测,通常应用于较大的数据集,对于数据及其收集方式的假设也更少。
在美国,博士通常持续 5-6 年。头两年你会上课,在剩下的几年里做研究。英国的博士学位较短(通常为 4 年),只做研究。与美国的博士不同,英国通常要求你完成硕士课程,但这取决于具体的大学。
对于研究,你需要撰写论文,论文就是对特定课题进行长期深入的探索,或者相关主题的论文集(在美国更为常见)。你的研究将经历几个阶段,从完善你将要探索的主题开始,然后从事相关研究项目,最后编写论文。
你将花大部分时间编程,做数学题,阅读论文,思考,并与合作者讨论你的想法。
5 大优点——将来可能高薪、自主性强、接受智力挑战、了解重要技术、推动人工智能发展
1. 了解未来十年最重要的技术
得益于理论突破、数据可用性和投资的增加,还有处理能力的提高,机器学习在过去十年中取得了飞速发展。机器学习已经成功应用于许多以前未解决的任务,包括自动驾驶、图说生成、游戏、操控直升机、合成语音和电影推荐。
商业利益爆炸式增长,推动了公司对技术型员工的需求和大型企业在收购机器学习初创公司方面的兴趣。2014 年以来被收购的大部分机器学习团队,收购方为每位员工所支付的平均价格为每人 250 万美元,有一家甚至出到了每位 1000 万美元。
技术不断改进,我们将能使越来越多的人力劳动自动化,并解决以前难以解决的问题。最终,我们可以制造出在大多数任务中比人类更有能力的软件。
这种进步将从根本上改变社会,其结果可好可坏。我们可以看到自动驾驶汽车的出现使交通事故死亡人数急剧下降,医疗诊断费用更便宜、医疗诊断更为准确,危险或枯燥工作由机器代劳。
同时,也可能出现自动化武器,社会普遍失业,政治和经济权力集中在少数人手中。更令人担忧的是,如果我们开发的软件具有高度智能,但有违人类的利益,那么这可能会产生灾难性的后果。
由于这些原因,我们认为机器学习是未来几十年中最重要的领域之一。尽管近期世人对机器学习兴趣有所增长,但这一技能仍然只掌握在相对较少的人手中。
2. 积极塑造人工智能的发展
根据我们的调查 [2],积极塑造人工智能的发展是对未来人类社会影响最大的问题领域,需要更多的机器学习专家参与,因此我们认为,从事这方面的工作是机器学习博士的最佳选择。(如果你在另一个高优先级问题领域有重要的经验,或者不同意我们对此重要性的评估,则不适用。)
拥有机器学习博士学位能给你良好的技术背景和信誉。在这个方向,主要有两条路可走。
1)技术安全研究
当前,人工智能技术研究人员存在短缺。机器学习博士可以为此做好准备。
2)政策与战略研究
AI 政策有助于政府、公司和非营利组织等机构的决策者设计和实施有助于塑造 AI 未来的政策。政策相关的工作岗位包括制定政策选择的研究人员和倡导和实施政策的从业人员。
3. 将机器学习应用于其他重要的社会问题
在美国,败血症和败血症休克占所有重症监护病历的 10%,所有医院死亡人数的 20-30%。约翰霍普金斯大学的科学家开发了一个名为 TREWScore 的机器学习系统来解决这个问题。相比标准的筛选方法,TREWScore 可以提前几个小时检测发生脓毒性休克的高风险患者,从而加速治疗。
机器学习可以用来解决有很多紧迫的问题,包括:
要从事这样的工作,你需要了解那些能将你的技能学以致用的社会问题。要获得这样的知识,你可以在公司或研究项目中实习,与其他工作人员交流。你可以在一家成熟的公司工作,开创自己的公司,或进行学术研究。
4. 获得高薪
市场对机器学习专业的需求使相关的职位都属于高薪范围:
这些数字包括仅需要硕士或学士学位的岗位,我们预计博士学位的收入将处于上述范围的高端。
这样的薪水可以让你赚钱,然后捐赠贡献社会。当然,这只是备选,比起捐赠,机器学习博士可以有其他更多的方式对社会做出更大的贡献。
由于机器学习的快速发展,相关技术能解决各种问题,相关的职业收益潜力很高(我们预计未来十年将持续保持高位)。然而,由于许多人有兴趣进入这一领域,也会有薪资下降的风险。
机器学习技能在技术创业公司中很有用,最近机器学习初创公司也在不断涌现。Y Combinator 前不久首次为 AI 创业公司增添了专门的渠道。大型公司近年来一直在收购 AI 创业公司,这些收购的价值通常取决于初创团队人员构成,而不是更常见的收入指标。自 2014 年以来,被收购的 AI 初创团队,每位员工的平均身价是 250 万美元,有一家甚至达到了 1000 万美元。
有业内人士告诉我们,机器学习博士学位很容易能在对冲基金领域能找到高薪工作。
5. 从事极富挑战、自主性高的工作
你会与一些地球上最有能力的人一起,从事思维上极具挑战的工作,你会对机器学习拥有深刻的理解。你有自由选择做什么,以及在什么时候做。
3 大缺点——不利于心理健康、花很长时间、将来竞争风险可能升高
1. 对心理健康是个挑战
虽然你在读博士的过程中做的工作令你很有成就感,但读博士也是众所周知的一场心理斗争。这通常是由于孤独,还有很难去适应高度自主的工作:“做研究可以让人感觉非常好,也可以感觉非常糟。大多数学生将读研称为过山车,峰值特别高,谷底特别低。”
2. 会花很长时间
读博士需要很长时间(4-6 年),在此期间你的薪酬相对较低。如果退学,你不但得不到博士学位(也丧失读博的大部分价值),最终结果可能还不如当初选择其他薪酬更低但回报快的职业。
3. 机器学习可能会变得更有竞争力
机器学习现在是很多人都想要进入的热点领域,所以也有很多风险,因为很多人聚集在这个专业,就业就变得更加困难。例如,MIT 机器学习导论课程最近有 700 人注册,学院不得不另外找人多的教室上课,还故意出很难的题目,让学生尽早挂科。另一方面,如果机器学习的发展速度比预期慢,没有达到炒作的程度,那么就业人数也可能会缩水。
要被录取,你需要有很强的理工科技能,通常本科学计算机科学、数学、工程、定量经济学或物理学来获得。最起码,你应该学过概率和统计、多变量微积分和线性代数。
我们也知道一些没有理工科背景,被机器学习硕士研究生项目录取的人,但这十分罕见。这需要你在其他地方(比如 MOOC)自学相关的数学课程。
在英国和欧洲其他地区,要读机器学习博士你一般需要先读机器学习硕士学位或计算机科学、数学等相关课程,但这取决于具体的大学。在美国、加拿大和澳大利亚,则通常没有这个必要,不过掌握这些绝对没有坏处。
不需要硕士学位的课程通常长于 1-2 年。如果你打算读硕士课程,那么两年制学位更好,因为你有更多的时间去做研究,而做研究是进入顶尖博士课程的关键。
根据在线指南和我们与业内人士交流的结果,是否被录取几乎完全取决于你能不能做好研究。
首先,你需要做过研究。如果你还是本科生,最好跟着你大学的老师做研究,或者申请一个暑期研究职位。许多研究小组都有本科生暑期研究职位,其中还一些是会付工资的(比如 REU)。
如果你要读机器学习硕士,选择一个有很强研究组成部分的项目,并尽快开始做研究。理想情况下,你应该在完成学位前先发表 1-2 篇论文。最不济,你至少应该完成了一篇研究论文,哪怕没有发表——研讨会论文、审查中的论文,还是上传到 Arxiv(任何人都可以提交),这些都管用。完成研究论文十分重要,如果没有把这件事做完,我们不建议你完成学位。
其次,你需要好的推荐信,理想情况下这封推荐信来自于领域知名学者,并且是你要申请的导师认识的人。推荐信要能够突出你做研究的潜力,而不仅仅是你学习能力强。
第三,你需要写一篇文章,介绍你的研究经验和你想要研究的事情。
第四,除非你打算做纯理论研究,你需要展示你编程的能力。证明这一点的最好办法是上过编程课程,或在工作或实习中有商业编程经验。
虽然不是必需,但对开源机器学习项目做出贡献,撰写有关机器学习技巧的博客文章,或参与 Kaggle 等竞赛也可以写进来。
如果申请美国大学,成绩(和 GRE 成绩)比研究经验和推荐信更重要。根据上述指南和我们交流过的专家,你的平均成绩(如果去美国大学)至少应该 3.6。不过,3.6 以上的分数并不会改变你没有研究经验的事实。有 3.6 之后就看研究经验了。
你的整体 GRE 一般应在 TOP 10% 或更高。理工部分的分数比口语和散文分数更重要,目标应在 165 分以上(≥95%),理工分数和总分 ≥90%(位于前 10%)。
近几年机器学习博士学位越来越热,许多院校今年的申请数量都创下历史新高。这可能会在未来几年增加入学要求的水平。另一方面,由于产业资助,更多的高校可能开设机器学习博士培养项目。
根据在线指南和我们实地交流的业内人士经验,最重要的标准是:
1. 研究组的声望。这个研究组应该是一个持续在顶级机器学习会议发表论文的团队。热门会议有哪些呢?
2. 你的导师:不要只看大学或学院的名声——你的导师对你的成功至关重要。
选择一个能和你一起工作并支持你的导师。你可以跟他现在的学生谈谈,看他们是否对你目标导师满意。
确保你导师的研究兴趣和你的兴趣一致。
如果前两个标准都符合,那么请去申请成功的,有声望的导师。负责大型实验室的著名研究人员通常拥有更好的资金和人脉,但是往往太忙而无法对你的工作及时反馈,因此可能比较难以处理。选择一位不那么有名但能及时提供帮助的导师可能会更好。或者,你可以在大学里同时选择多名顾问/导师。如果你在感兴趣的领域有多名顾问/导师也很有帮助。
3. 导师和实验室的稳定性和资源。你应该找一个稳定、资金充足的实验室和导师。或者,你申请到奖学金(如 NSF 和 NSERC 的奖学金),那么你可以和资金较少的导师合作。同时,记得查看你的目标导师是否在考虑在你读博期间换实验室。读博中途导师离开对你来说可能是灾难性的,因为你可能很难找到另一位合适的导师。
教学负担:有些部门要求你做很多的教学工作,减少你做研究的时间。
4. 实验室氛围和兼容性:你会与其他学生和博士后合作并一起学习。因此,实验室的氛围是很重要的,如果可能,你最好能参加实验室的研讨会,或与现在的学生交流一下。
5. 选一个你开心的地方:在人生地不熟的地方读博是很困难的,选一个至少让你开心的地方吧。
6. 有高影响力的研究工作:例如,如果你想从事人工智能安全方面的工作,那么在大学里有人工智能安全研究小组是十分有用的,你可以在你的博士期间从事相关的工作,并且与领域内的其他研究人员建立联系。
加分项:
与当地产业的联系:如果你想了解在博士后期间做什么,那么你可以考虑与当地产业的联系。因此,如果你对创业公司或大型科技公司感兴趣,旧金山湾区的大学,比如斯坦福大学和加州大学伯克利分校是优选;为了更好地与 DeepMind 建立联系,你应该能去英国读大学。
整体项目的声望:如果要读机器学习专业,那么机器学习专业强的研究组比整个大学的名气要重要得多。
举例来说,如果你想攻读 AI 安全相关的博士学位,下面是一份不完全列表:
以下是最有希望的一些课题:
深度学习
虽然不同的机器学习方法对不同的应用都是有用的,但是深度学习在过去10年终取得了令人瞩目的成功。深度学习是受人类大脑网络结构启发的一种方法,尽管二者之间差异很大。
深度学习帮助我们解决了许多以前的人工智能技术无法解决的问题,包括在图像识别问题上的成功,以及“预测潜在的药物分子的活性,分析粒子加速器数据,重建大脑回路,预测非编码DNA突变对基因表达和疾病的影响。”
由于深度学习取得的许多成功,深度学习的专业知识不管对在机器学习前沿工作的公司,还是积极促进AI发展的研究者来说都是很有价值的。
强化学习
利用强化学习,软件根据其环境采取行动,以最大化地得到编程定义的奖励。例如,下面的视频展示了 DeepMind 的玩 Atari 游戏的软件。它的目的是得到最高的分数,并通过来回移动拍子采取行动。
强化学习很重要,因为它是一种创建可以执行多个不同的任务的AI的有前途的方法,而当前大多数机器学习系统的适用性非常窄。
鉴于深度学习现在非常热门,学强化学习方向的博士可能不像深度学习那么困难。你也可以同时学这两个方向,即深度强化学习。
应用
如果要实现机器学习的某种应用,例如视觉识别或语音识别,那么需要考虑的有几件事情。只要你具有基础的机器学习方法,选择什么应用区别不大。但是,选择在什么应用工作仍然需要考虑。
理想的工作是已经取得一些进步但仍有提升的空间的领域。
在企业实习可以成为读博的有益补充,能让你了解行业的工作原理,获得实践经验(比如谷歌的基础设施),还有工作机会,激发你新的研究方向。从机器学习社区的声誉来看,企业机构分为几等:
顶级:DeepMind,OpenAI,Google Brain,Facebook AI Lab(FAIR)
第二梯队:百度,微软,亚马逊,Twitter,苹果,IBM
第三梯队:深度学习初创公司(点击下图,查看 CB Insights 总结的 60 家值得关注的 DL 初创公司),机器学习公司(点击下图,查看机器智能 3.0 市场图景),以及培养博士生毕业生将其技能应用于行业的公司
CB Insights 日前汇集了美国市值超过 10 亿美元估值的独角兽公司地理分布情况,新智元结合该公司今年 9 月汇总的 2016 年全球值得关注的 60 多家深度学习初创企业,更新数据。一起来看看这些独角兽和深度学习企业之间都有哪些联系吧。【继续阅读】
今年的 3.0 版生态全景图,比两年前的第一版增加了三分之一的公司,而且更加详细、尽量全面,但它也只触及了这个领域无限活力的表面。机器智能堆栈的“一站式服务”(one stop shop)第一次进入人们的视野——尽管它正式化需要一至两年。这种堆栈的成熟或能解释,为什么越来越多的著名公司更加专注于建立合法化的机器智能。任何对此时刻保持头脑清醒的人能够做出初期的发展和购买决定,所以我们认为尽早尝试布局这些技术比不尝试更好。【继续阅读】
在你读其他理工科博士学位时,比如应用数学,统计学或物理学,也可以进行机器学习研究。如果你想尝试这种可能性,首先要在大学机器学习实验室进行会谈,参加研究小组会议。然后,你可以看看是否能与那里的研究人员一起工作(一般都可以这样做,不需要转专业或换导师),或者安排对研究组进行几个月的访问交流。
参考资料
https://80000hours.org/career-reviews/artificial-intelligence-risk-research/
Applying to Ph.D. Programs in Computer Science
‘The field of Machine Learning seeks to answer the question "How can we build computer systems that automatically improve with experience, and what are the fundamental laws that govern all learning processes?"’ Mitchell, Tom Michael. The discipline of machine learning. Vol. 9. Carnegie Mellon University, School of Computer Science, Machine Learning Department, 2006.↩
http://web.archive.org/web/20170313102628/http://shikharsharma.com/publications/msc-thesis.pdf
编译来源:https://80000hours.org/career-reviews/machine-learning-phd/
点击阅读原文查看新智元招聘信息