专栏名称: AI数据派
THU数据派"基于清华,放眼世界",以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯,定期组织线下活动,分享前沿产业动态。了解清华大数据,敬请关注姐妹号“数据派THU”。
目录
相关文章推荐
河北交通广播  ·  【992 | 祝贺】哪吒2破135亿! ·  昨天  
河北交通广播  ·  【992 | 注意】明起,出分! ·  昨天  
河北交通广播  ·  刘德华方紧急声明! ·  2 天前  
中金固定收益研究  ·  【中金固收·信用】中国公司债及企业债信用分析周报 ·  4 天前  
河北交通广播  ·  【992 | 最新】《哪吒2》,破130亿! ·  3 天前  
51好读  ›  专栏  ›  AI数据派

收藏 | 超全数据科学与机器学习面试指南(附资源)

AI数据派  · 公众号  ·  · 2018-07-24 07:30

正文

来源:AI前线

本文共 5782 ,建议阅读 10 分钟

本文是 一份完整的清单,涵盖了在数据科学与机器学习面试中可能会遇到的各种题目、学习案例以及智力测试题。


[ 导读 ] 你是否有志于成为一名数据科学家,却又因为不知如何克服面试而头疼不已?跨入数据科学领域并不是一件简单的事。因此,在进行面试之前,你最好能做好充分的准备。

介绍


你是否有志于成为一名数据科学家,却又因为不知如何克服面试而头疼不已?好吧,其实你不是一个人!跨入数据科学领域并不是一件简单的事,而如果你不具备数据科学方面的背景,实现这一目标更是难上加难(很可能这正是你的现状吧)。


而你从其他同样想成为数据科学家的人们那里所听来的各种故事,说不定会使面试这件事更加令人望而生畏。因此,在进行面试之前,你最好能进行充分的准备。


你会被问到哪些问题?需要进行哪些准备,参考哪些资料?典型的数据科学面试的过程是怎样的?你的身体语言应当怎样表现?这些问题或许正浮现在你的脑海中。



别担心,来这里就对了!


我本人也同样经历过这段过程。相信我,克服数据科学面试的唯一办法,就是进行充分的练习并实现较高的质量。因此,请确保你进行一系列项目的训练。如果你正在寻找数据科学方面的项目,可以参考一下这些内容。


https://www.analyticsvidhya.com/blog/2018/05/24-ultimate-data-science-projects-to-boost-your-knowledge-and-skills/


此外,你还需要对常规的面试流程进行对应的练习,这也是本文的重点。


在本文中,我们将提供一份完整的清单,涵盖了在数据科学与机器学习面试中可能遇到的题目,学习案例以及智力测试题。 此外,我们也列举了一些额外的资料,包括各种实用的提示与诀窍,希望通过这些指导让你顺利通过面试。


本文列举的内容是你能找到的最全面的终极资料,请务必将本文保存到收藏夹中,今后每次需要准备面试时都可能会用得到。


祝学习愉快,面试顺利!


目录

  1. 数据科学与统计问题

  2. 机器学习问题

  3. 深度学习问题

  4. 案例学习

  5. 智力题与猜估

  6. 特定的工具与语言问题

  7. 新手提示与诀窍

  8. 励志的故事


1. 数据科学与统计学问题


这部分内容的目标是测试、强化及提高你对数据科学与统计学方面概念的理解能力。涵盖了概率与相关性;线性回归与逻辑回归等等。当你看完最后一篇问题后,你对相关概念的掌握就会变得相当扎实。



40个创业公司在机器学习与数据科学方面常见的问题


文章地址:

https://www.analyticsvidhya.com/blog/2016/09/40-interview-questions-asked-at-startups-in-machine-learning-data-science/


本文列举了 40 个你在面试中很可能遇到的现实而又棘手的问题。如果你能够理解并解答这些问题,就可以放心了,你的面试表现将出十分出色。答出这些问题的关键,在于你是否对于机器学习及相关的统计学概念有着扎实的、具有实践性的理解。


数据科学方面的 40 个概率论问题


文章地址:

https://www.analyticsvidhya.com/blog/2017/04/40-questions-on-probability-for-all-aspiring-data-scientists/


概率论被视为诸多数据科学相关概念与技术的基础,为了赢得成为数据科学家职位的机会,你必须很好地掌握概率论。本文中的题目将评测出你对概率论的掌握程度。


7 个最常见的相关性问题


文章地址:

https://www.analyticsvidhya.com/blog/2015/06/correlation-common-questions/


相关性是数据科学领域的核心概念之一,虽然表面看起来简单,但实际上它也有一些难以掌握的特性。如果你正在学习统计学方面的概念,就必然要面对这些大部分人试图回避的问题。即使是已经精通统计学的读者,本文也可以帮助他们巩固这方面的知识。


数据科学家与分析师相关的 41 个统计学问题


文章地址:

https://www.analyticsvidhya.com/blog/2017/05/41-questions-on-statisitics-data-scientists-analysts/


在开始统计学相关领域的面试前,你需要充分掌握这方面的概念。为了帮助你提高并测试统计学方面的知识水平,我们精心准备了这一份问题列表。本文涵盖了描述统计与推论统计方面的问题,并为每个问题提供了解答。


评测数据科学家在线性回归方面知识的 30 个问题


文章地址:

https://www.analyticsvidhya.com/blog/2017/07/30-questions-to-test-a-data-scientist-on-linear-regression/


在数据科学行业与学术界,线性回归仍然是用于解释特征之间的关联性最常用的统计学技术之一。如果你希望成为一位数据科学家,线性回归是一项你必须充分了解的技术。


评测你对于逻辑回归理解水平的 30 个问题


文章地址:

https://www.analyticsvidhya.com/blog/2017/08/skilltest-logistic-regression/


逻辑回归很可能是处理所有分类问题中最常用的算法。文章中所列举的问题是经过精心设计的,专门用于测试你在逻辑回归及其细节问题相关知识的掌握程度。


2. 机器学习问题


机器学习已经成为大量企业的核心策略,如果你希望在这一领域发展你的职业生涯,就需要准备好面对这些难题。这一部分的内容将会最大限度地测试你的机器学习技能。


评测数据科学家在机器学习方面能力的 40 个问题


文章地址:

https://www.analyticsvidhya.com/blog/2017/04/40-questions-test-data-scientist-machine-learning-solution-skillpower-machine-learning-datafest-2017/


如果你已经是(或者正打算成为)一名数据科学家,则必须掌握机器学习,别无选择。文章中的问题是经过特别设计用来测试你对于机器学习概念性知识的掌握程度的,它将使你做好进入这一行业的准备。现在请准备开始测试吧!


评测数据科学家在自然语言处理方面能力的 30 个问题


文章地址:

https://www.analyticsvidhya.com/blog/2017/07/30-questions-test-data-scientist-natural-language-processing-solution-skilltest-nlp/


自然语言处理(NLP)是一种对机器进行训练,使机器能够理解人类的语言及文字的科学。它是机器学习行业中发展非常迅猛的一个领域。各企业已开始意识到通过使用机器学习方式,从人类书写的文本中汲取指导性见解的强大力量。请完整地阅读这些问题,看看你在 NLP 方面的掌握程度如何。


评测数据科学家在树模型方面能力的 30 个问题


文章地址:

https://www.analyticsvidhya.com/blog/2017/09/30-questions-test-tree-based-models/


决策树(Decision Trees)是机器学习及数据科学领域中最为人所推崇的算法之一,它的优点在于清晰、易于理解、天然的健壮性以及广泛的适用性。你可以看到该算法实际进行了哪些操作,以及它采用了哪些步骤以获得最终方案。在某些业务场景中,如果需要向项目干系人解释某个决策的理由,上述特点就变得非常重要。这部分内容也是面试环节中的一个重要组成部分。


评测数据科学家在支持向量机方面能力的 25 个问题


文章地址:

https://www.analyticsvidhya.com/blog/2017/10/svm-skilltest/


你可以将机器学习算法想象成一个军工厂,其中堆满了刀剑和斧头等武器。尽管你有这么多工具可选择,但仍然要学习如何在正确的时机使用它们。“支持向量机”(Support Vector Machines)可以比喻为一把锋利的小刀 —— 它用于处理较小的数据集,但通过这些小型数据集,它就可以在创建模型方面发挥更强大的能力。通过对文章中的 25 个问题进行自测,可以提升你在这一成熟技术方面的知识。


评测报告数据科学家在降维技能方面能力的 40 个问题


文章地址:

https://www.analyticsvidhya.com/blog/2017/03/questions-dimensionality-reduction-data-scientist/


在面试中,最常见的问题之一是如何处理庞大的数据集,它可能包含百万级的数据行以及几千个数据列。在你遇到这类问题时,对降维(Dimensionality Reduction)技术的理解以及了解在哪些场景下使用这个技术将会非常有帮助。


评测数据科学家在聚类技术方面能力的 40 个问题


文章地址:

https://www.analyticsvidhya.com/blog/2017/02/test-data-scientist-clustering/


在通过非标签化数据获取认识的过程中,聚类(Clustering)技术扮演着一个重要的角色。它将数据分类为类似的分组,它为各种商业决策提供了基本的理解能力,从而提升了决策的准确性。聚类广泛应用在市场、财务与其他多个产业中。这又是一个你必须了解的概念,请务必充分掌握。


3. 深度学习问题


深度学习是目前在人工智能行业中最火热的研究领域,在它的带动下,各种令人惊叹的创新和震撼的突破层出不穷,而这才仅仅是个开始!不过,这一领域的工作机会却相对稀少。如果你有幸得到一次面试机会,务必对各种困难问题进行充分的准备,在深度学习领域的工作是没有捷径的。这部分内容可以使你认识到是否已经为面试做好了准备。



评测数据科学家的深度学习基础知识的 45 个问题


文章地址:

https://www.analyticsvidhya.com/blog/2017/01/must-know-questions-deep-learning/


如果你希望进入深度学习行业,文章中的问题是你必须了解的,也相对比较简单。在阅读这一部分的后续文章之前,先尝试着做一下本文中的测验,看看你的水平如何。如果遇到你不熟悉的概念,文章中也提供了相应的学习资源的链接。让我们开始吧!


评测数据科学家的深度学习能力的 30 个问题


文章地址:

https://www.analyticsvidhya.com/blog/2017/08/skilltest-deep-learning/


本文是测试你的深度学习知识水平的一个良好的起点,文中列举了从初级到高级的各类问题。在这篇测试问题刚发布后,从结果来看,很明显大多数进行测试的读者都没有充分地掌握深度学习的知识。你能拿出更好的表现么?来试试看吧!


评测数据科学家的深度学习能力的 40 个问题


文章地址:

https://www.analyticsvidhya.com/blog/2017/04/40-questions-test-data-scientist-deep-learning/


本文的内容是上一篇文章的续篇,它将测试你对于深度学习概念的知识水平。


评测数据科学家的图像处理能力的 25 个问题


文章地址:

https://www.analyticsvidhya.com/blog/2017/10/image-skilltest/


在深度学习世界中,图像处理是当前最火热的领域。由于 Google 和 IBM 这些业界巨头纷纷发布了用于生成图像分类模型的自动化平台,人们对这一领域的热情也在不断升温。本文所列举的问题将测试你在处理图像数据,尤其是图像处理这部分的知识水平。


12 个深度学习方面的常见问题


文章地址:

https://www.analyticsvidhya.com/blog/2018/05/deep-learning-faq/


虽然本文的内容并不是特别针对面试而设计的,但你仍然应当完整地回答每个问题。其中包括一些最基础的深度学习问题,对你来说应该是小菜一碟。


4. 案例学习


案例学习也是数据科学面试流程中的一个重要环节,在遇到这类问题时,面试经理一定会考查你的结构化思维能力。请确保你仔细阅读以下案例,在查看答案之前,先尝试自己解决这些问题,然后再对照答案检查一下你的回答。


通过动态规划方式以 10 倍的速度解答面试中的案例


文章链接:

https://www.analyticsvidhya.com/blog/2016/05/ase-studies-10x-faster-using-dynamic-programming/


动态规划并不是一种仅仅通过提供的输入值就能够给出正确答案的秘诀或是数学公式,而是通过结合结构化思维和逻辑思维而完成任务的一种方式。这种概念已经有一定的历史了,目前的使用场景也并不算多。如果你学会了这种独特的方式,面试官一定会大为震惊的!


数据分析能力面试的案例 —— 出租车调配问题


文章链接:

https://www.analyticsvidhya.com/blog/2016/04/case-study-analytics-interviews-dawn-taxi-aggregators/


出租车调配在某些地方已经成为一个重要的课题。在本文中,我们将解决一个出租车调配的案例。除此之外,我们也需要特别关注像一位专家一样处理案例问题的关键点所在。像贝恩、BCG 和麦肯锡这样的咨询公司,都很看重面试者在面对案例分析时能否像专家一样思考。本文将助你成为具备这种素质的面试者。


分析学面试中的一个案例


文章链接:

https://www.analyticsvidhya.com/blog/2014/02/interesting-analytics-case-study/


这是一道经典的路径优化问题,给你几条可选择的道路的相关数据,让你指出最省时间的走法。每答出一道问题,下一题你将面对更多的数据,一步步深入整个案例。这正是你将在面试中面对的情形,开足马力吧!


适合新手的案例:呼叫中心优化(难度中)


文章链接:

https://www.analyticsvidhya.com/blog/2016/04/case-study-level-medium-call-center-optimization/


本文介绍了一个真实生活中的场景:对某个呼叫中心的工作进行优化。通过学习这一案例,你可以摸索出如何在这样一个操作密集的职位上模拟出整个环境。文中的代码是用 R 语言实现的,不过即使你不熟悉 R,也可以在 Excel 里完成这一问题。


案例学习:为某个线上商家优化产品价格(难度高)


文章链接:

https://www.analyticsvidhya.com/blog/2016/07/solving-case-study-optimize-products-price-online-vendor-level-hard/


由于在现实世界中的广泛应用,该案例也成为了一道经典题目。它的目标是为某家线上商家优化产品价格体系,其实即便在实际生活中,你也需要进行类似的计算。因此,该案例不仅仅是一道数学题目,同样也具有现实意义。在应聘较高级的职位时,类似的案例经常出现在面试过程中。因此请尽力一试吧!


5. 智力与猜估题


如果你有志成为一名数据科学家,那么直觉性的思考以及快速计算和组织思维的能力将成为一个关键点。这也正是面试官会首先考验你的问题之一,他会提出一道智力题或猜估题(或是两者皆有),以考验你能否快速而逻辑性地解决这些富有挑战性的题目。这部分内容将帮助你为克服这些挑战做好准备!



通过猜估题测试的诀窍


文章链接:

https://www.analyticsvidhya.com/blog/2014/01/tips-crack-guess-estimate-case-study/


猜估题在分析学与管理咨询相关的面试过程中非常普遍。如果你希望顺利通过数据科学面试,本文对于帮助你通过第一步非常有用。在本文中,你将学习到一些经过测试与验证的技巧,以帮助你克服猜估题。


每个分析师都应解决的 20 道富有挑战性的面试智力题


文章链接:

https://www.analyticsvidhya.com/blog/2016/07/20-challenging-job-interview-puzzles-which-every-analyst-solve-atleast/


作者在文章中介绍了他在面试数据科学职位时曾遇到的几道最困难、最有挑战性的智力题。这些面试题出自高盛、亚马逊、谷歌和摩根大通等公司。


大部分面试者都无法通过的 3 道智力难题


文章链接:

https://www.analyticsvidhya.com/blog/2016/01/3-tricky-puzzles-people-wrong-job-interviews/


本文所介绍的三道智力难题是大多数人在面试中都无法做对的题目。由于这些题目本身就难以理解,如果你无法一次性得出答案也很正常。千万不要放弃!有些时候,最难的问题反而有着最简单的解决方法。


分析学面试中常见的智力题(第 1 部分)


文章链接:

https://www.analyticsvidhya.com/blog/2014/09/commonly-asked-puzzles-analytics-interviews/


本文涵盖了在面试中最常见的一些智力问答题,由于这些问题相对简单,不用费多少功夫就应当得出答案。万一你在规定时间内无法解出其中的两道题,或许可以尝试一下解答不同类型的智力题,熟悉一下解决这些问题的思路。


分析学面试中常见的智力题(第 2 部分)


文章链接:

https://www.analyticsvidhya.com/blog/2014/10/commonly-asked-interview-puzzles-part-ii/


本文的第二部分与上半部分的内容是一脉相承的,由易到难解决各种智力题。题目共分为三个部分,并且第一部分的问题是没有给出解决方案的。如果你无法自行得出答案,意味着你或许需要从头开始学习解答智力题的技巧!


6. 针对特定工具与语言的问题


每个有志成为数据科学者的读者至少应掌握一门工具,以处理质量分析问题。不过,你掌握的工具越多,你的技能就越广,坐上你想要的职位的机会也就越大。在数据科学职位的面试过程中,工具类的问题是不可缺少的一环,在你开始实际面试前,应该对这一点做好充分准备。这一部分的内容涵盖了 Python、R、SQL 以及 SAS。



数据科学评测之 R 语言技能的 40 个问题


文章链接:

https://www.analyticsvidhya.com/blog/2017/05/40-questions-r-for-data-science/


本文中的练习将全面地测试你的 R 语言技能,包括编程问题以及概念性问题。在答题时请快速给出答案。我的建议是在自测时给每道题设定时间限制,这样在面对面试组的时候就不至于手足无措。


4个高难度的 R 面试题


文章链接:

https://www.analyticsvidhya.com/blog/2014/05/tricky-interview-questions/


R 是当今最受欢迎编程语言之一,这主要得益于它开源的本质,以及优秀的用户社区。文中的 4 个问题是当你面对面试的压力时可能会遇到的最困难的问题。最好对此进行精心准备!


在面试中常见的 4 个棘手的 SAS 问题


文章链接:

https://www.analyticsvidhya.com/blog/2013/11/4-sas-tricky-analytics-interview/


SAS 与其它语言的不同之处在于它非常易于编写。但某些 SAS 方面的问题还是非常有难度的,对于部分面试者来说确实相当困难。本文介绍了 4 个这类问题,并提供了详细的案例以帮助你着手克服这些困难。


在 SAS 基础方面的一些高难度面试题


文章链接:

https://www.analyticsvidhya.com/blog/2014/04/tricky-base-sas-interview-questions-part-ii/


本文实际上是前文的后续,文中的问题与本系列文章中的上一篇相比难度更高,题目也更长。会问到这些问题的公司往往在分析学方面有着比较强的基础,大数据问题的处理是它们的日常任务之一。


数据科学评测之 Python 技能测试方面的 40 个问题


文章链接:

https://www.analyticsvidhya.com/blog/2017/05/questions-python-for-data-science/


Python 在数据科学相关工具中已经牢牢地占据了领先地位。文中所列举的问题是与这门编程语言相关的必读题。在参加数据科学方面的面试之前,请确保你已经经过这些问题的测试,为自己打下一个良好的基础。


评测数据科学家的 42 个 SQL 问题


文章链接:

https://www.analyticsvidhya.com/blog/2017/05/questions-sql-for-all-aspiring-data-scientists/


无论你使用哪种语言进行建模,掌握 SQL 语言都是你的简历中不可缺少的一部分。否则,走上数据科学家岗位的机会就变得非常渺茫。本文列举了一份详尽的问题,充分磨练你的 SQL 技能,以做好面试的准备。


7. 新手提示与技巧


对于刚刚跨出校门的毕业生来说,获得一份数据分析方面的职位并不容易。某些幸运儿或许能够被企业选中,委任数据分析方面的工作。但是不能指望这种幸运会凭空而降!本文是特别为新手所设计的,以帮助他们更好地准备面试的流程。







请到「今天看啥」查看全文


推荐文章
河北交通广播  ·  【992 | 祝贺】哪吒2破135亿!
昨天
河北交通广播  ·  【992 | 注意】明起,出分!
昨天
河北交通广播  ·  刘德华方紧急声明!
2 天前
河北交通广播  ·  【992 | 最新】《哪吒2》,破130亿!
3 天前
娜姐的光影笔记  ·  我跟你们讲,牛逼的女人根本不care男人!
7 年前
吃什么情报局  ·  里脊肉除了糖醋还能怎么做好吃~
7 年前
十点读书  ·  懂你的人最温柔
7 年前