专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
数据派THU  ·  公示 | ... ·  3 天前  
大数据D1net  ·  2025年大数据重回焦点,决定AI成败 ·  3 天前  
数据派THU  ·  准确、快速地从头预测RNA ... ·  1 周前  
51好读  ›  专栏  ›  大数据文摘

2017数据科学实训营 | 六十天手把手系统学习,学会为止

大数据文摘  · 公众号  · 大数据  · 2016-12-30 07:38

正文



稀牛学院是专注于数据科学/人工智能垂直领域学习社区,提供系统全面的数据科学/人工智能领域课程学习,包括免费公开课,国外优秀垂直领域课程翻译(如斯坦福人工智能课程)和在线直播课程,定期会有深度的学习交流文章+大咖分享。


数据科学实训营是稀牛学院推出的针对入门数据科学最有系统性操作性和实战性黄埔军校”,是稀牛学院目前唯一运用云实验室平台在线授课的一门课程。

2017年新年之际,我们专门聘请三位一线工业界老司机,花费60天时间,带领100位学员全项目实战,手把手搞定数据科学职业技能培养数据科学工业界需要的数据挖掘工程师和机器学习入门工程师

实训营计划招募100参与需要进行系统个人能力测评层层审核并非所有人都适合参与。

我们希望我们提供给每一位学员的价值都是长期的、可持续的。


 通过实训营你可以获得什么


1. 节省时间量身打造面向工业界实践所需技能的学习路线,2个月的时间手把手带你走完全程不用再走其他弯路少踩很多坑;

2. 实战项目大型互联网公司实际案例项目实操亲身体验实习感觉;

3. 实训环境不只是在线直播真正丰富友好的7*24小时动手实操云环境平台;

4. 专人辅导,3位讲师 + 10位助教+2位班主任三位一体随时解答遇到的各种困难

5. 良师益友在这里你会结识和你一样优秀的一群人这可能是你一生的财富


 实训营计划做什么 


具体来说7周时间内(14节精讲+14节实战练习+2节面试辅导+2节毕业设计答辩),我们将会按照每周一个模块的学习进程通过线上直播+云平台实验实操结合的方式依次带领大家完成以下几个模块的学习——


1. 基础编程知识夯实


  • 将学习到Python基础知识、常用库与工程技巧

  • 配合课程讲解与云平台练习及小组讨论你将掌握python编程技能数据类型与各种数据结构使用完成具体任务的函数编写常用的工程技巧

  • 试验编号SXY001-Python场景练习200

2. 数据获取与存储技能实训


  • 将学习到爬虫相关知识对网页信息抓取清洗解析与存储

  • 配合课程讲解与云平台练习及小组讨论你将掌握对工作所需或感兴趣的数据(网页文本、图片等)抓取与解析和数据库存储相关技能。掌握scrapy库对知乎和微博、豆瓣等的数据获取和存储案例。

  • 试验编号SXY002-网页爬虫数据知乎、微博与新闻网站数据抓取与存储有更好玩的随时补充



3. 数据分析技能实训


  • 将学习到数据上的统计计算与分析方法

  • 配合课程讲解与云平台练习及小组讨论你将掌握对已有数据统计分析和基本决策辅助的能力。熟练查询和使用pandastxtcsvoffice xls等不同类型的数据读写与多种复杂计算、操作。

  • 试验编号SXY003-数据分析实验多种格式文件的读写与操作,pandas无障碍操作练习影评数据统计分析人口信息分析美国大选数据分析区域医疗数据分析 



4. 可视化技能实训


  • 将学习到几种可视化库与工具对全局数据和结果做可视化动态展示结果

  • 配合课程讲解与云平台练习及小组讨论你将掌握使用matplotlibseaborn等对数据进行同步分析和可视化展示的能力。

  • SXY004-数据可视化实验基本的分布与曲线拟合绘图、交通数据可视化、美国大选数据分析可视化等


5. 大数据技能实训


  • 将学习到hadoop相关知识基本Map-reduce原理与spark知识

  • 配合课程讲解与云平台练习及小组讨论你将掌握hadoop部分组件使用方法手写map-reduce解决大数据处理的方法spark完成统计和简单建模的能力。

  • SXY005-大数据技能实验手写map-reduce完成大数据的统计海量文本数据处理,spark大数据处理示例、spark mllib分布式机器学习简单建模训练



6. 机器学习应用实训


  • 将学习到针对已有数据进行特征抽取与建模使用机器学习辅助问题决策的知识

  • 配合课程讲解与云平台练习及小组讨论你将掌握在已有数据的基础上如何结合问题场景进行有效的数据处理与特征抽取并在此基础上使用多种建模库工具(scikit-learnxgboostlightGBM,liblinear,libsvm)进行机器学习建模与应用的能力。

  • SXY006-机器学习实验,Kaggle泰坦尼克号之灾、自行车租赁、房价预测、电商销量预测、新闻主题分类、文本褒贬分析等案例 



7. 综合应用实训


  • 将完成从数据获取解析、分析可视化到机器学习建模应用的完整案例

  • 配合课程讲解与云平台练习及小组讨论你将掌握数据科学完整的流程并能独当一面完成在公开数据微博、知乎等上的应用项目。

  • 结业项目包括数据采集、清洗、存储、分析、可视化和建模等流程的标准化项目。

整个流程如下图所示:



整个过程学习很烧脑,同时也要严格把控自我时间跟上魔鬼的步伐,一步两步三步,找准自我的节奏~

 实训营计划适合谁 


1. 在校学生对数据科学未知充满想象力不满足于学校学习的课程内容希望以后从事数据相关的工作

2. 希望转型的IT从业人士对数据科学具备强烈的兴趣对技能升级已有相当强的紧迫感不满足当前的工作希望通过本次学习转向热爱的数据科学领域


如果你想加入实训营你应该具备以下条件


1.迎接挑战有可控的时间跟得上学习的节奏和高强度的云平台练习

2.希望能提高动手实践实操能力渴望通过数据创造出令人愉快的可视化成果

3.有强大的自主学习能力对数学和编程仍充满学习的乐趣

4.希望和一群和你一样对数据科学充满兴趣有能量且价值观相近的亲密伙伴共同学习


 关于实训营核心导师:

稀牛学院三大导师将亲自带队 



艾伦,UiiTech创始人,原TypeScore首席数据科学家 牛津大学计算机系毕业机器学习/深度学习专家伦敦金融创新实验室(InnovationLab)AI构架、大数据/ML/DL应用核心研发工程师牛津求学期间师从Prof. Nandode Freitas(GoogleDeepMind的领军人物


常老师,博士毕业于清华大学自动化系控制理论与控制工程专业 在百度负责过多个产品线的数据挖掘、统计和分析工作后承担搜索广告策略的相关研究工作现电商从事数据挖掘与算法策略的研究应用工作。


寒小阳 大数据文摘机器学习专栏主编 资深算法工程师专注海量数据上机器学习算法的应用与优化有多年实际机器学习/深度学习/数据挖掘项目经验负责过多个电商机器学习项目。做过推荐系统、文本挖掘、点击率预估、深度学习图像识别与检索。擅长用通俗易懂的方式直观解释机器学习相关知识并辅以案例帮助理解。


除以上3位核心导师外还会有行业导师加入实训营计划成为导师或教练与你见面。

 如何申请 


请点击阅读原文填写相关信息,收到相关信息后,我们会将测试表单通过邮件发送给您。您需要在2017年1月19日晚24:00前完成能力测评报名表单我们审核通过后会在120日前通过微信或电话联系你邀请加入我们的数据科学实训营——

温馨提示越早报名录取机会越大,早报名早进群早学习。


 关于课程安排及价格 

时间:2017121-326 19:30-21:30,连续7扣除年假一周


(★代表在线上课代表实操练习

学习方式:每周二/六在线直播手把手教学周四/日云实验平台实操实练直播课程可反复观看有效期一年

招募人数:100

费用:3980元/570美元学生可分期付款详情联系稀牛客服牛妞微信号shujupeixun

优惠政策:

1.早鸟优惠:1.10之前报名价格3480

2.群体优惠老学员优惠200学生优惠200

3.团购优惠转介绍各赠送50元听课券可用作非本次课程外的其他所有课程);

以上优惠均可累加最低优惠早鸟优惠+老学员+学生优惠=3080

激励机制:

1.“最优奖学金计划”:10%优秀学员奖励1000RMB;

2.课程完成计划所有课程按时完成并最终获得B评分以上学员奖励500RMB(评分含ABCD四类获得最优秀奖学金学员不可重复获奖);

3.前五组优秀学习小组组员按小组名次可依次获得100元听课券1张、200元听课券1张、100/200元听课券各1张共300元、200元听课券2张共400元、100元听课券1/200元听课券2张共500听课券可用作除本课程之外稀牛学院所有课程每次课程只能使用一张听课券

报名咨询:报名后请务必联系客服微信号大数据文摘-牛妞shujupeixun(备注:实训营手机号:15510583388  QQ: 3530548572

戳【阅读原文】获取申请表。