12月11日
晚8点直播
主题:
人工智能消化道病理辅助诊断平台——从方法到落地
12月12日
晚8点直播:
利用容器技术打造AI公司技术中台
12月17日
晚8点直播
主题:
可重构计算:
能效比、通用性,一个都不能少
出品 | AI科技大本营(ID:rgznai100)
这位来自越南的小姐姐 Chi Huyen 目前居住在硅谷,不仅是一位计算机科学家,同时也是一位作家。她在斯坦福拿到了学士和硕士学位,曾在Netflix,Primer,Baomoi.com等公司工作,目前在Nvidia的人工智能应用团队。
这位小姐姐不仅热爱矩阵乘法,而且热爱生活、享受旅行。喜欢用笔记录点点滴滴,她是越南四本畅销书的作者。近期,Chi Huyen 小姐姐又分享了自己的一份新作品《机器学习面试书》,今天我们就为大家分享和简单介绍这部值得期待与收藏的面经,目前在 Github 上已经获得了 2.5k Stars,先码上地址。
https://docs.google.com/presentation/d/1MX2V6fTp71j1aztvY5HLYM44iLG4HYMrYd4Dxn6Cxnw/edit#slide=id.g6152350dbb_0_259
这是一本关于机器学习工程师的面试书籍,希望她独特的视角能让你对面试更加有信心。
首先来看一下这本书的目录,主要包括了绪论、设计一个机器学习系统、案例学习、面试题练习四个板块,共22页。相对于动辄几百页的书籍,这本小册子内容简洁,但针针见血,不浪费每一页的篇幅。教会你如何轻松应对面试中的场景题。
这部分包含了 27 个开放式问题,这些问题可以测试你将学到的知识用于设计系统以解决实际问题的能力。面试官提出一个可能与他们产品有关的问题,并要求设计一个机器学习系统来解决该问题,更熟悉一点的叫法也可以称为”场景题“。这类问题在面试中非常流行,几乎每次面试过程中都会涉及这类问题,甚至在一个小时的面试中,会遇到两个或更多这样的问题。
重点是这些问题没有最准确的答案,尽管有些答案有一定的标准,但解决问题的方法有很多,面试官可以询问很多后续问题,来评判候选人的知识,执行能力和批判性思维能力。对面试者来说,重要的是要很好的表达出自己的思维过程,展现自己是了解系统中的约束,trade-off 和需要重点关注的问题,这样就足够了。
有些面试者对这类型的问题会有恐惧,这是因为他们没有系统的梳理自己的知识,没有一个框架。这本书也并不会给出这类题完美的答案,因为完美的答案是不存在的。相反,这本书旨在为大家在解决这类问题时提供一个解题框架。
设计机器学习系统是一个反复的过程。该过程通常包括四个主要部分:项目设置,数据管道,建模(选择,训练和调试模型)和服务(测试,部署,维护)。
一个步骤的输出可能会更新先前一步的内容。如下面这些场景:
(1)
在检查了可用数据之后,当你意识到不可能获取到解决先前定义问题所需的数据,这时需要换种方式来构造问题。
(2)训练后意识到需要更多数据或需要重新标记数据。
(3)在向用户提供初始模型后,发现他们使用产品的方式与您在训练模型时所做的假设有很大不同,因此必须要面临更新模型等问题。
要学习好如何设计机器学习系统,需要阅读案例研究,以了解实际情况中团队是如何应对不同的部署要求和限制条件的。Airbnb,Lyft,Uber,Netflix 等许多公司都有非常出色的技术博客,在这些博客中,他们分享了使用机器学习改进产品或流程的经验。如果大家对这些公司感兴趣,也可以访问他们的技术博客来了解他们的工作,这些可能也会在面试中出现!
而本书就为提供了10个案例供大家学习,下面是一些出色的案例研究:
这些问题的答案将发布在《机器学习面试》一书中。
大家可以在GitHub 网站上查看,也可以在社区对这些问题的答案做出贡献。这些问题都来自一线面试,非常具有参考意义和实战型。一共有27个问题。
https://github.com/chiphuyen/machine-learning-systems-design/blob/master/build/build1/consolidated.pdf
大家还可以在下面的网站中阅读更多与书有关的信息,也注册成为该书的贡献者之一。
https://huyenchip.com/2019/07/21/machine-learning-interviews.html
(*本文为AI科技大本营整理文章,
转载
请微信联系 1092722531)
开幕倒计时4天,
6.6 折票限时特惠(立减1400元)倒计时 1 天,学生票仅 599 元!|
2019 中国大数据技术大会(BDTC)即将震撼来袭!
豪华主席阵容及百位技术专家齐聚,十余场精选专题技术和行业论坛,超强干货+技术剖析+行业实践立体解读。