专栏名称: AI数据派
THU数据派"基于清华,放眼世界",以扎实的理工功底闯荡“数据江湖”。发布全球大数据资讯,定期组织线下活动,分享前沿产业动态。了解清华大数据,敬请关注姐妹号“数据派THU”。
目录
相关文章推荐
山西省人民政府  ·  山西这些集体、个人拟获全国表彰 ·  13 小时前  
山西省人民政府  ·  今年山西第一批向民间资本推介项目名单公布 ·  20 小时前  
山西省人民政府  ·  今年山西第一批向民间资本推介项目名单公布 ·  20 小时前  
老乡俱乐部乡宁站  ·  山西8座煤矿名单公布! ·  昨天  
51好读  ›  专栏  ›  AI数据派

独家 | 怎样从编程零基础入行分析领域(附学习资源)

AI数据派  · 公众号  ·  · 2017-12-28 07:30

正文

翻译:杨雪涤

校对:冯羽

本文长度为 2107字 ,建议阅读 5 分钟

本文为你分享分析领域的入门经验,并推荐相关免费课程和书籍。


怎么从编程零基础到可以在科技和分析领域工作?


如果你对学习这些技能感兴趣,不管是为了开心还是职业转换,哪条路是最好的呢?


市面上有无数个网课清单,但你要怎样分辨出最适合你的那一条路?


我自己从没想过我会学习任何这方面的实操技能,像编程、数据分析、或相关科技。鉴于我是金融专业的,我总是设想我会成为一名“商务人士”。但不知怎么的,我自学了Python和SQL,而且还在“ Jet.com” 找到了分析领域的工作,每天都会用到这些语言中的一种。

你可能会问,为什么要学习Python和SQL?


Python是目前发展最迅速的编程语言 fastest growing programming )它拥有大量工具库,可以用来编写机器学习应用程序、数据分析、可视化、网页应用程序、API集成等。而且,它是最容易上手和掌握的语言之一。对于SQL,各种数据库强化了技术公司的能力, SQL能让你更好地理解、探索和利用收集到的数据。

下面,我将讲述一下我是怎样从学习这些语言到入门数据分析的学习之路。讲真,这条路很具有挑战性。我曾有无数个夜晚感到心力交瘁。有很多个晚上我只想拱手认输,安于当一名商务人士。


但是你内心的动力依然是在不可避免的各种阻力中推动你前进的关键。


不管你是想进军数据分析、数据科学这类的领域,还是只是觉得学一些编程和科技好玩儿(实际上它确实很好玩儿);如果你是真的想好好学的话,你要让自己保持自律和动力满满。


对于我来说,每天回家后立即安排一定的时间(大约90分钟到2小时)学习和练习,让我形成了坚持的习惯并且彻底理解了那些我曾觉得迷惑的概念。


下面是我的学习之路,希望能给大家一些启发。

关键的基础


1. 学习“Python the Hard Way”


这是我那个时期上过最好的课程之一。它是自主的、有挑战性的,但Zed给了你 你学习在Python上编程足够的细节和指导。他让编程变得好理解,而且每周发放的学习材料真的会给你能学好Python的信心。


2. 模式分析:Pandas


模式分析给了Python一个完美的介绍,包括基于它最强的一个的数据结构的各种例子:pandas数据框( the Pandas DataFrame)。一旦你掌握了python的这些知识,学习数据分析就比较容易上手了。


3. 模式分析:SQL Mode Analytics: SQL


另一个关于SQL的学习教程也很棒。你可以学习到很多关键概念,打好SQL坚实的基础。他们甚至有他们自己的SQL编辑器和你可以用来“玩耍”的数据。


连同模式分析, W3 Schools 可以解答任何你在学习过程中遇到的关于SQL的问题。

正确的地进入机器学习


在我完全掌握Python之前,我尝试申请了优达学城的自驾车微学位。我知道这完全是我无法承担的,但我想,为什么不试试呢?


当被实际的应用程序而迷住时,你更容易激励自己学习Python和机器学习。



在课程开始前我还有一个月的时间,所以我上了尽可能多的关于数据科学和机器学习的课。


这是我认为最好的、极有帮助的免费介绍类课程:


  • Udacity Machine Learning Intro (优达学城机器学习介绍)

  • Udacity Intro to Statistics (优达学城统计学介绍)

  • Udacity Intro to Data Science (优达学城数据科学介绍)

TensorFlow ,由谷歌公司开发,是一个可以在Python上操作的开源机器学习工具包。它很强大,当然也值得被熟悉。


"MNIST exercise" 是TensorFlow框架下一个极好的入门检验练习。


我发现 " Stanford CS231" 这个课程也很有用。它包括了卷积神经网络(用在图片或面部识别软件里),这对获得自驾车微学位是极其有帮助的。如果你只是对图片或视频形式的机器学习感兴趣的话,你不会找到比这个课程更好的了。

最后,用这些资源搭建好坚实的基础后,我开始了" Udacity Self Driving Car Nanodegree" .(优达学城自驾车微学位)的学习。

我不打算过多谈论它因为已经有很多关于这门课的文章。我想说的是,尽管是我所经历过的最具挑战性的课程,但我还是能够理解大部分的内容。有了正确的基础知识,你会惊讶于你对复杂主题的理解有多深。

持续的分析和数据科学的学习


在深入学习了几个月的机器学习之后,对我帮助很大的是后退一步,加强我对实用分析和数据科学原理的理解。


我开始学习如何用python学习数据科学,深度学习,和机器学习( Data Science, Deep Learning, & Machine Learning with Python ),这是优达学城一门很棒的课程。在接触机器学习时,它完全涵盖了分析、数据科学和统计的原则,特别是围绕不同的数据挖掘技术和部署它们的实际场景。


Data Science For Business 》一书中,也很好地解释了某些模型在解决特定环境中的问题时是如何工作的以及为什么会起作用;它会强化你的分析框架和思维模式,以适应围绕数据问题出现的任何情况。这是我发现的最好的资源,它将不同的分析方法与特定的业务情况和问题联系起来。

当然,如果你对从事分析或数据科学的职业感兴趣,你应该经常锻炼你曾经拥有的技能,然后继续增加新的技能。 FreeCodeCamp Hackernoon 发布了关于所有数据科学和软件工程的信息文章和教程。最近我最喜欢的文章是一篇关于写自己的区块链( blockchain )的教程。


你想知道继续学习的最好方法吗?

构建一些东西。任何东西。探索数据集。找出一个你或你的公司面临的实际问题,并试着去解决它。

即使你无法访问公司的高质量数据,也有大量的开源数据集可供你使用和练习。我敢打赌,你会学到和学习任何课程或阅读任何书一样多的东西,甚至更多。

最后,与拥有你想要获得的技能的人见面和学习是非常有益的。我强烈建议您使用 Meetup 来在您的地区寻找分析或软件专业人员。许多这样的团体都有免费的教程或学习课程,你会遇到很多超级聪明的人,他们可以提供一些技巧和技巧来加速你的学习。

在纽约市,一些帮助过我的团体是:

  • Machine Learning Society

  • Google Developer Group

  • NYAI

  • New York Data Science


祝你学习愉快!


原文标 题:

Teach Yourself Data Science: the learning path I used to get an analytics job at Jet.com

链接:

https://medium.freecodecamp.org/a-path-for-you-to-learn-analytics-and-data-skills-bd48ccde7325


杨雪涤 ,目前就读于北京科技大学。对国际交流、英语学习和大数据很感兴趣,善于将大数据灵活地运用到生活中。曾作为捷克斯洛伐克代表参加2017年哈佛大学模拟联合国,并利用寒假赴巴厘岛支教一周。

翻译组招募信息

工作内容: 将选取好的外文前沿文章准确地翻译成流畅的中文。如果你是数据科学/统计学/计算机专业的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友,数据派翻译组欢迎你们加入!







请到「今天看啥」查看全文


推荐文章
山西省人民政府  ·  山西这些集体、个人拟获全国表彰
13 小时前
山西省人民政府  ·  今年山西第一批向民间资本推介项目名单公布
20 小时前
山西省人民政府  ·  今年山西第一批向民间资本推介项目名单公布
20 小时前
老乡俱乐部乡宁站  ·  山西8座煤矿名单公布!
昨天
人民日报  ·  大新闻!“习特会”来了
7 年前