专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
软件定义世界(SDX)  ·  史上最全!统计学中常用的数据分析方法大总结! ·  昨天  
大数据文摘  ·  对于那些出来卖的DeepSeek课程,我有些 ... ·  3 天前  
天池大数据科研平台  ·  一文漫谈DeepSeek及其背后的核心技术 ·  3 天前  
黑马程序员  ·  喜报!应届生均薪破万,最高薪资24000元! ·  3 天前  
黑马程序员  ·  喜报!应届生均薪破万,最高薪资24000元! ·  3 天前  
51好读  ›  专栏  ›  大数据文摘

2017数据科学实训营 | 六十天手把手系统学习,学会为止

大数据文摘  · 公众号  · 大数据  · 2016-12-30 07:38

正文



稀牛学院 是专注于数据科学/人工智能垂直领域学习社区,提供系统全面的数据科学/人工智能领域课程学习,包括免费公开课,国外优秀垂直领域课程翻译(如斯坦福人工智能课程)和在线直播课程,定期会有深度的学习交流文章+大咖分享。


数据科学实训营 是稀牛学院推出的针对入门数据科学最有系统性操作性和实战性 黄埔军校 ”, 是稀牛学院目前唯一运用云实验室平台在线授课的一门课程。

2017 年新年之际 ,我们 专门聘请三位一线工业界老司机,花费 60 天时间, 带领 100 位学员 全项目实战,手把手搞定数据科学职业技能 培养数据科学工业界需要的数据挖掘工程师和机器学习入门工程师

实训营计划招募 100 参与需要进行系统个人能力测评 层层审核 并非所有人都适合参与。

我们希望 我们提供给每一位学员的价值都是长期的、可持续的。


通过实训营你可以获得什么


1. 节省时间 量身打造面向工业界实践所需技能的学习路线 ,2 个月的时间手把手带你走完全程 不用再走其他弯路 少踩很多坑 ;

2. 实战项目 大型互联网公司实际案例项目实操 亲身体验实习感觉 ;

3. 实训环境 不只是在线直播 真正丰富友好的 7*24 小时动手实操云环境平台 ;

4. 专人辅导 ,3 位讲师 + 10 位助教 +2 位班主任 三位一体随时解答遇到的各种困难

5. 良师益友 在这里 你会结识和你一样优秀的一群人 这可能是你一生的财富


实训营计划做什么


具体来说 7 周时间内 (14 节精讲 +14 节实战练习 +2 节面试辅导 +2 节毕业设计答辩 ), 我们将会按照每周一个模块的学习进程 通过线上直播 + 云平台实验实操结合的方式依次带领大家完成以下几个模块的学习 ——


1. 基础编程知识夯实


  • 将学习到 Python 基础知识、常用库与工程技巧

  • 配合课程讲解与云平台练习及小组讨论 你将掌握 python 编程技能 数据类型与各种数据结构使用 完成具体任务的函数编写 常用的工程技巧

  • 试验编号 SXY001-Python 场景练习 200

2. 数据获取与存储技能实训


  • 将学习到爬虫相关知识 对网页信息抓取 清洗 解析与存储

  • 配合课程讲解与云平台练习及小组讨论 你将掌握对工作所需或感兴趣的数据 ( 网页文本、图片等 ) 抓取与解析和数据库存储相关技能。掌握 scrapy 库对知乎和微博、豆瓣等的数据获取和存储案例。

  • 试验编号 SXY002- 网页爬虫数据 知乎、微博与新闻网站数据抓取与存储 有更好玩的随时补充



3. 数据分析技能实训


  • 将学习到数据上的统计计算与分析方法

  • 配合课程讲解与云平台练习及小组讨论 你将掌握对已有数据统计分析和基本决策辅助的能力。熟练查询和使用 pandas txt csv office xls 等不同类型的数据 读写与多种复杂计算、操作。

  • 试验编号 SXY003- 数据分析实验 多种格式文件的读写与操作 ,pandas 无障碍操作练习 影评数据统计分析 人口信息分析 美国大选数据分析 区域医疗数据分析



4. 可视化技能实训


  • 将学习到几种可视化库与工具对全局数据和结果做可视化 动态展示结果

  • 配合课程讲解与云平台练习及小组讨论 你将掌握使用 matplotlib seaborn 等对数据进行同步分析和可视化展示的能力。

  • SXY004- 数据可视化实验 基本的分布与曲线拟合绘图、交通数据可视化、美国大选数据分析可视化等


5. 大数据技能实训


  • 将学习到 hadoop 相关知识 基本 Map-reduce 原理与 spark 知识

  • 配合课程讲解与云平台练习及小组讨论 你将掌握 hadoop 部分组件使用方法 手写 map-reduce 解决大数据处理的方法 spark 完成统计和简单建模的能力。

  • SXY005- 大数据技能实验 手写 map-reduce 完成大数据的统计 海量文本数据处理 ,spark 大数据处理示例、 spark mllib 分布式机器学习简单建模训练



6. 机器学习应用实训


  • 将学习到针对已有数据进行特征抽取与建模 使用机器学习辅助问题决策的知识

  • 配合课程讲解与云平台练习及小组讨论 你将掌握在已有数据的基础上 如何结合问题场景 进行有效的数据处理与特征抽取 并在此基础上使用多种建模库工具 (scikit-learn xgboost lightGBM,liblinear,libsvm ) 进行机器学习建模与应用的能力。

  • SXY006- 机器学习实验 ,Kaggle 泰坦尼克号之灾、自行车租赁、房价预测、电商销量预测、新闻主题分类、文本褒贬分析等案例



7. 综合应用实训


  • 将完成从数据获取解析、分析可视化到机器学习建模应用的完整案例

  • 配合课程讲解与云平台练习及小组讨论 你将掌握数据科学完整的流程 并能独当一面完成在公开数据 微博、知乎等 上的应用项目。

  • 结业项目 包括数据采集、清洗、存储、分析、可视化和建模等流程的标准化项目。

整个流程如下图所示:



整个过程学习很烧脑,同时也要严格把控自我时间跟上魔鬼的步伐,一步两步三步,找准自我的节奏~

实训营计划适合谁


1. 在校学生 对数据科学未知充满想象力 不满足于学校学习的课程内容 希望以后从事数据相关的工作

2. 希望转型的IT从业人士 对数据科学具备强烈的兴趣 对技能升级已有相当强的紧迫感 不满足当前的工作 希望通过本次学习转向热爱的数据科学领域


如果你想加入实训营 你应该具备以下条件


1. 迎接挑战 有可控的时间跟得上学习的节奏和高强度的云平台练习

2. 希望能提高动手实践实操能力 渴望通过数据创造出令人愉快的可视化成果

3. 有强大的自主学习能力 对数学和编程仍充满学习的乐趣

4. 希望和一群和你一样对数据科学充满兴趣 有能量且价值观相近的亲密伙伴共同学习


关于实训营核心导师:

稀牛学院三大导师将亲自带队



艾伦,UiiTech创始人,原TypeScore首席数据科学家 牛津大学计算机系毕业 机器学习 / 深度学习专家 伦敦金融创新实验室 (InnovationLab)AI 构架、大数据 /ML/DL 应用核心研发工程师 牛津求学期间师从 Prof. Nandode Freitas(GoogleDeepMind 的领军人物


常老师,博士毕业于清华大学自动化系控制理论与控制工程专业 在百度负责过多个产品线的数据挖掘、统计和分析工作 后承担搜索广告策略的相关研究工作 现电商从事数据挖掘与算法策略的研究应用工作。


寒小阳 大数据文摘机器学习专栏主编 资深算法工程师 专注海量数据上机器学习算法的应用与优化 有多年实际机器学习 / 深度学习 / 数据挖掘项目经验 负责过多个电商机器学习项目。做过推荐系统、文本挖掘、点击率预估、深度学习图像识别与检索。擅长用通俗易懂的方式直观解释机器学习相关知识 并辅以案例帮助理解。


除以上 3 位核心导师外 还会有行业导师加入实训营计划 成为导师或教练 与你见面。

如何申请


请点击 阅读原文 填写相关信息,收到相关信息后,我们会将测试表单通过邮件发送给您。您需要在 2017年1月19日晚24:00前 完成能力测评报名表单







请到「今天看啥」查看全文