各有关单位:
在大数据时代,在商业、经济及其他领域中基于数据和分析去发现问题并作出科学客观的决策越来越重要;python是一种面向对象直译式计算机程序设计语言,也是一种功能强大的通用型语言,近几年已经成为最受欢迎的动态编程语言之一,被越来越多的科研人员用来处理实验数据、制作图表及开发科学计算应用程序,采用Python做科学计算的研究机构日益增多,Python逐渐被认为是学习和实现机器学习技术最好的语言之一,Python是美国大学计算机科学系入门课程最受欢迎的编程语言,计算机科学系Top10中有8家在入门课程中教授Python,包括卡耐基、麻省理工学院在内的国外很多高校,都已经选用Python作为教学语言。
为了协助满足行业对python数据处理相关高端人才的迫切需求,我单位将于近期举办“python大数据挖掘与分析(机器学习)核心技术培训班”,具体安排详见附件。
附件:
一、培训对象
从事计算机、云计算、大数据、互联网等相关领域项目的科研院所的项目负责人、科研人员、工程技术人员;各地方政府信息中心负责人、技术骨干;大数据产业投资团队,大数据应用开发商,大数据服务提供商等;有志于python机器学习研究和应用的个人及从业者,高校相关专业的教学科研人员、高年级本科生及研究生。
二、培训目标
1,让学员尽快掌握python语言的基本结构与语法与数据类型,模块、基本用法,熟悉函数,类设计,包的使用及基本的编程方法;
2,理解python数据挖掘与分析技术在当代各种大数据相关产品中的应用,并掌握该领域最关键技术的原理以及技术应用过程;
3,能开发出一些实际的应用项目并初步胜任Python的数据挖掘和机器学习工作;
4,通过紧密结合应用实例,针对工作中存在的疑难问题进行分析讲解和专题讨论,进而有效提升学员解决科研及教学中实际问题的能力同时提升其从数据角度去思考的能力;
三、培训特点
培训采用理论知识+案例示范+辅导练习的教学模式,将语言的应用与实际业务相结合,突出软件学习的应用性,从应用案例入手讲解知识点,既用简洁易懂的语言讲述理论方法,又同时进行实际数据挖掘分析演示;不仅仅适合零基础的初学者,同时也适合经验较为丰富的操作者;提供全部教学课件、源代码、编程操作步骤,每个模块均设置动手实践环节以协助学员解决操作中的实际问题;后期将通过学员交流群建立与授课专家的长期答疑联系,提供全天候即时在线技术咨询。
四、教学大纲
第一天
|
第1讲:数据分析方法概述及相关工具
|
-
1.
认识数据
-
2.
数据分析的步骤和原则(确定/分解/评估/决策)
-
3.
相关工具概述及对比(excel/spss/R/matlab/python/Java)
|
第2讲:python环境和基础语法与
|
-
1.
安装anaconda套件
-
2.
基本数据结构(列表/字符串/字典)
-
3.
基本语法(条件/循环/函数/类/模块)
-
4.python
语言编程的最佳实践经验
-
5.python
在业界的典型应用
|
第3讲:基础工具库
|
-
1.
基础环境linux/ipython
-
2.
数值计算 numpy
-
3.
绘图与可视化 matplotlib与 Chart
-
4.
数据操作 pandas
-
5.
高级应用案例分享
|
第二天
|
第4讲:统计分析库
|
-
1.
概率和统计分析 statsmodels
-
2.
科学计算和最优化 scipy
-
3.
线性回归和逻辑回归 statsmodels
|
第5讲:数据挖掘概览
|
-
1.
数据挖掘与模型
-
2.
建模流程和步骤
-
3.
常见算法
-
5.
高级应用案例解析
|
第6讲:典型数据挖掘项目示范
|
-
1.
基于titanic数据集预测生存概率
-
2.
演示如何进行绘图探索
-
3.
特征处理和建模
-
4.
练习及答疑
|
第三天
|
第7讲:数据挖掘与机器学习
|
-
1.
感知机
2
决策树
-
3.
特征工程
-
4.
正则化方法
-
5. PCA
-
6.
练习和答疑
|
第8讲:机器学习进阶(一)
|
-
1.
参数调优
-
2.
集成学习
-
3.
文本挖掘
-
4.
神经网络
-
5.
深度学习
-
6.
练习和答疑
|
第9讲:机器学习进阶(二)
|
-
1.
基于MNIST数据集识别数字
-
2.
展示如何进行特征构造
-
3.
常规机器学习算法和深度学习算法的效果差异
-
4.
机器学习的结果评估
-
5.
深度学习的最新进展分享
|
第10讲:现代分析技术的应用(选修)
|
-
1.
|