稀牛学院
是专注于数据科学/人工智能垂直领域学习社区,提供系统全面的数据科学/人工智能领域课程学习,包括免费公开课,国外优秀垂直领域课程翻译(如斯坦福人工智能课程)和在线直播课程,定期会有深度的学习交流文章+大咖分享。
数据科学实训营
是稀牛学院推出的针对入门数据科学最有系统性操作性和实战性
“
黄埔军校
”,
是稀牛学院目前唯一运用云实验室平台在线授课的一门课程。
在
2017
年新年之际
,我们
专门聘请三位一线工业界老司机,花费
60
天时间,
带领
100
位学员
全项目实战,手把手搞定数据科学职业技能
,
培养数据科学工业界需要的数据挖掘工程师和机器学习入门工程师
;
实训营计划招募
100
人
,
参与需要进行系统个人能力测评
,
层层审核
,
并非所有人都适合参与。
我们希望
,
我们提供给每一位学员的价值都是长期的、可持续的。
通过实训营你可以获得什么
?
▼
1.
节省时间
,
量身打造面向工业界实践所需技能的学习路线
,2
个月的时间手把手带你走完全程
,
不用再走其他弯路
,
少踩很多坑
;
2.
实战项目
,
大型互联网公司实际案例项目实操
,
亲身体验实习感觉
;
3.
实训环境
,
不只是在线直播
,
真正丰富友好的
7*24
小时动手实操云环境平台
;
4.
专人辅导
,3
位讲师
+ 10
位助教
+2
位班主任
,
三位一体随时解答遇到的各种困难
;
5.
良师益友
,
在这里
,
你会结识和你一样优秀的一群人
,
这可能是你一生的财富
;
实训营计划做什么
?
▼
具体来说
,
在
7
周时间内
(14
节精讲
+14
节实战练习
+2
节面试辅导
+2
节毕业设计答辩
),
我们将会按照每周一个模块的学习进程
,
通过线上直播
+
云平台实验实操结合的方式依次带领大家完成以下几个模块的学习
——
1.
基础编程知识夯实
-
将学习到
Python
基础知识、常用库与工程技巧
-
配合课程讲解与云平台练习及小组讨论
,
你将掌握
python
编程技能
,
数据类型与各种数据结构使用
,
完成具体任务的函数编写
,
常用的工程技巧
-
试验编号
SXY001-Python
场景练习
200
题
;
2. 数据获取与存储技能实训
-
将学习到爬虫相关知识
,
对网页信息抓取
,
清洗
,
解析与存储
-
配合课程讲解与云平台练习及小组讨论
,
你将掌握对工作所需或感兴趣的数据
(
网页文本、图片等
)
抓取与解析和数据库存储相关技能。掌握
scrapy
库对知乎和微博、豆瓣等的数据获取和存储案例。
-
试验编号
SXY002-
网页爬虫数据
,
知乎、微博与新闻网站数据抓取与存储
(
有更好玩的随时补充
)
3. 数据分析技能实训
-
将学习到数据上的统计计算与分析方法
-
配合课程讲解与云平台练习及小组讨论
,
你将掌握对已有数据统计分析和基本决策辅助的能力。熟练查询和使用
pandas
对
txt
、
csv
、
office xls
等不同类型的数据
,
读写与多种复杂计算、操作。
-
试验编号
SXY003-
数据分析实验
,
多种格式文件的读写与操作
,pandas
无障碍操作练习
,
影评数据统计分析
,
人口信息分析
,
美国大选数据分析
,
区域医疗数据分析
4. 可视化技能实训
-
将学习到几种可视化库与工具对全局数据和结果做可视化
,
动态展示结果
-
配合课程讲解与云平台练习及小组讨论
,
你将掌握使用
matplotlib
和
seaborn
等对数据进行同步分析和可视化展示的能力。
-
SXY004-
数据可视化实验
,
基本的分布与曲线拟合绘图、交通数据可视化、美国大选数据分析可视化等
。
5. 大数据技能实训
-
将学习到
hadoop
相关知识
,
基本
Map-reduce
原理与
spark
知识
-
配合课程讲解与云平台练习及小组讨论
,
你将掌握
hadoop
部分组件使用方法
,
手写
map-reduce
解决大数据处理的方法
,
及
spark
完成统计和简单建模的能力。
-
SXY005-
大数据技能实验
,
手写
map-reduce
完成大数据的统计
,
海量文本数据处理
,spark
大数据处理示例、
spark mllib
分布式机器学习简单建模训练
6. 机器学习应用实训
-
将学习到针对已有数据进行特征抽取与建模
,
使用机器学习辅助问题决策的知识
-
配合课程讲解与云平台练习及小组讨论
,
你将掌握在已有数据的基础上
,
如何结合问题场景
,
进行有效的数据处理与特征抽取
,
并在此基础上使用多种建模库工具
(scikit-learn
、
xgboost
、
lightGBM,liblinear,libsvm
等
)
进行机器学习建模与应用的能力。
-
SXY006-
机器学习实验
,Kaggle
泰坦尼克号之灾、自行车租赁、房价预测、电商销量预测、新闻主题分类、文本褒贬分析等案例
7. 综合应用实训
-
将完成从数据获取解析、分析可视化到机器学习建模应用的完整案例
-
配合课程讲解与云平台练习及小组讨论
,
你将掌握数据科学完整的流程
,
并能独当一面完成在公开数据
(
微博、知乎等
)
上的应用项目。
-
结业项目
,
包括数据采集、清洗、存储、分析、可视化和建模等流程的标准化项目。
整个流程如下图所示:
整个过程学习很烧脑,同时也要严格把控自我时间跟上魔鬼的步伐,一步两步三步,找准自我的节奏~
实训营计划适合谁
?
▼
1.
在校学生
:
对数据科学未知充满想象力
,
不满足于学校学习的课程内容
,
希望以后从事数据相关的工作
;
2.
希望转型的IT从业人士
:
对数据科学具备强烈的兴趣
,
对技能升级已有相当强的紧迫感
,
不满足当前的工作
,
希望通过本次学习转向热爱的数据科学领域
;
如果你想加入实训营
,
你应该具备以下条件
:
1.
迎接挑战
,
有可控的时间跟得上学习的节奏和高强度的云平台练习
;
2.
希望能提高动手实践实操能力
,
渴望通过数据创造出令人愉快的可视化成果
;
3.
有强大的自主学习能力
,
对数学和编程仍充满学习的乐趣
;
4.
希望和一群和你一样对数据科学充满兴趣
,
有能量且价值观相近的亲密伙伴共同学习
;
关于实训营核心导师:
稀牛学院三大导师将亲自带队
▼
艾伦,UiiTech创始人,原TypeScore首席数据科学家
牛津大学计算机系毕业
,
机器学习
/
深度学习专家
,
伦敦金融创新实验室
(InnovationLab)AI
构架、大数据
/ML/DL
应用核心研发工程师
,
牛津求学期间师从
Prof. Nandode Freitas(GoogleDeepMind
的领军人物
)
。
常老师,博士毕业于清华大学自动化系控制理论与控制工程专业
在百度负责过多个产品线的数据挖掘、统计和分析工作
,
后承担搜索广告策略的相关研究工作
,
现电商从事数据挖掘与算法策略的研究应用工作。
寒小阳 大数据文摘机器学习专栏主编
资深算法工程师
,
专注海量数据上机器学习算法的应用与优化
,
有多年实际机器学习
/
深度学习
/
数据挖掘项目经验
,
负责过多个电商机器学习项目。做过推荐系统、文本挖掘、点击率预估、深度学习图像识别与检索。擅长用通俗易懂的方式直观解释机器学习相关知识
,
并辅以案例帮助理解。
除以上
3
位核心导师外
,
还会有行业导师加入实训营计划
,
成为导师或教练
,
与你见面。
如何申请
▼
请点击
阅读原文
填写相关信息,收到相关信息后,我们会将测试表单通过邮件发送给您。您需要在
2017年1月19日晚24:00前
完成能力测评报名表单
,