走自己的路
让别人无路可走
各位模友是否还记得这篇文章《
算法胜利,人类自由意志将终结
》,
尤瓦尔·赫拉利的
《未来简史》和
《人类简史》。
在他看来,人类祖先智人之所以能够崛起统治地球,是因为其拥有强大的虚构能力,人类现存的一切——国家、宗教、企业等都是虚构出来的现实,是一种基于想象的共同体。正因为有了这样的共同认知,人类才能够有效协作,形成更大规模的全球性连接,才有了地球主宰的地位和今日物质的进步。
书没看没关系,但你一定听过一个传言,随着人工智能的发展,很多人将变得毫无价值,被机器取代。换句话说,我们将只有两条路,
要么被取代
,
要么取代别人
。
如果让小天来选,当然是
“走自己的路,让别人无路可走。”
如果你也这么想,又是想干场大事的小白,那么恭喜你。
“少侠,我看你骨骼清奇,是万中无一的奇才。我有本秘籍,和你有缘,免费送你了”
《Python大法》
为什么又是Python?
编程语言有很多啊,像Matlab, VBA等等。难道是仅仅因为Python长的格外妖娆美艳么?
(Python英译为“莽蛇”)
当然不是。选语言,不仅要看
“外貌”
,还要看
“背景”
。
Python真是背景显赫。
其实,Python更像一个应用商店,里面有各式各样开发好的App,解决相应的问题。如果你需要,拿来用就是。有时候,甚至只需一行代码,就能解决问题。
用业内行话讲,Python有庞大的社区生态和随手拈来的开源系统。而且,IT巨头和大量开发者都还在持续地添砖加瓦。
更过份的是,这些基本都是免费的。
比如,就金融来说,
可以通过爬虫技术获取股票数据,
可以通过文字信息进行文本分析,
可以搭建回测系统,
可以开发交易平台。
而对于科研来说,Python的网络爬虫和文本分析技术早已出现在各种期刊中:
统计研究:
《
一种基于网络爬虫技术的价格指数计算模型
》
统计研究:
《
新经济业态P2P网络借贷的风险甄别研究
》
科技管理:
《
管理研究中基于API的网络数据获取方法浅析
》
旅游论坛:
《
基于旅游博客和论坛提高旅游产品质量的模型研究
》
电力行业信息化年会:
《
网络爬虫在电力广域网信息收集中的应用
》
再高级的,
比如自然语言分析,
比如神经网络、深度学习。
没有做不到,只有想不到。
有个Wind的朋友,跟我讲过一个数据,使用他们接口的,Matlab最多,但Python增长最快,眼看着就快超过Matlab。这也印证了Python不断壮大的社区。
Python是一个生态系统。学习Python,不仅仅是学习语法,
更应该知道该学什么,不需要学什么。
毕竟,大家都这么忙,我们不可能把所有App都撸一遍。
为什么有那么多人选择Python,真的有那么好吗?
大数据与人工智能时代的到来,让越来越多的专业,除了本身专业知识的学习,也需要
网络采集和数据分析
的技能,因为数据俨然已成为价值评估的一种标准。
因为出行数据,滴滴知道你是一个爱爬山的人;
因为通信数据,中国移动知道你是一个跟父母很亲近的人;
因为购物数据,阿里巴巴知道你现在还是单身。
而这一切的结论的背后,可以基本上说是数据挖掘的功劳。而作为一名非专业的销售人员、金融人员、科研人员,想做一次数据分析初体验,
Python无疑是
最适合的入门语言
。
为什么你看了那么多书,仍然学不会?
现在是市面上的Python图书,基本是计算机专业的人写的,你看书的目录,感觉体系好完整,内容好丰富,但是你一章一章都下来,发现作者是按知识板块讲的,各种技术点都列出来了,比如先讲数据导入,举几个例子,然后下一章讲pandas数据整理,又举了一堆小例子,然后再一章线性回归,套用几个例子,再一章逻辑回归,然后对应几个例子。
如果你是数据分析的初学者,当你看完书,要做数据分析的时候,却不知从何下手。
为什么呢?我们为什么要把编程的细节都搞清楚呢?
用Python做数据分析,也许只用到了Python里面很少的模块,做了那么多年数据分析,我看你只用得到线性回归、逻辑回归。
读者真正想了解的是,当我遇到一个问题,我应该怎么样开始做分析,整个分析流程的步骤是什么样的,每一步要怎么做,有什么坑是需要避免的,分析之后的结果怎么样解读,怎么样呈现。画图的函数那么多,可我只用到了柱形图、直方图,我只需要知道什么时候用他们就行了。
传统的图书或培训课程,就好像孔乙己教你茴香豆的“茴”有九种写法一样,可是
生活中你只需要会一种
啊。
那现在怎么办?
那你赶紧搭上Python这趟车。
7月21日~7月23日,北京理工大学大数据创新学习中心联合雪晴数据网,将举办
Python爬虫与机器学习应用案例研讨会
的专题讨论会议。
这是一次
高手过招
的机会,让你体验一下Python的快感。
三大高手,一一对决:
陈堰平
,雪晴数据网创始人,北京理工大学大数据创新学习中心导师团成员,2017年1月获“微软最有价值专家”荣誉称号,曾获CQF国际数量金融认证,先后任新华社指数中心技术总监、SupStat Analytics中国区首席技术官。在统计咨询、数据挖掘、开发数据驱动的商业解决方案等领域有近十年的经验。
曾有杰
,人人车计算平台架构师及策略小组负责人,前搜狐大数据平台研发工程师,多年数据分析与开发的工作经验,擅长网络爬虫技术和自然语言处理,对大数据平台、数据挖掘有丰富的实战经验。
谈和
,中国传媒大学互联网信息研究院博士生。中国传媒大学大数据挖掘与社会计算实验室研究员,主要负责数据抓取、文本处理以及可视化开发。同时也是中国传媒大学数据新闻专业的授课者之一,负责教授信息图设计制作和可视化编程等技能。目前的研究方向为互联网群体传播与群体行为、社会媒体研究中的自然语言处理。
作为一次严肃的研讨会,本次课程竟然是老师带着直接做各种实战案例:
①无论是电影数据、天气数据、还是基金数据都不是问题,只有想不到的数据,没有处理不了的方法;
②
抓取与汽车、3C产品的相关评论,使用自然语言处理技术做
舆情分析、品牌形象评价、意见挖掘
和
情感分析,
直接
用于产品设计和营销决策
。
学文本分析一定要写很多代码吗?不,用knime可以界面化操作就可以啦。
此次课程,更是引入
knime
软件做为讲解的平台,整个分析过程都在可视化的环境下进行,通过简单的拖曳和设置就可以完成一个分析流程的开发
(如下图所示,每个节点都包含一段预先定义好的Python代码,完成分析流程中的一步),
这样大大降低了学员的理解难度,提高了Python代码的复用度,
让数据分析编程更简单
。
使用knime做为开发环境,可以在少写好多Python代码
表弟:最喜欢这种有实际应用案例的课程,像我这种入门级的计算机爱好者可以报名参与吗?
超模君:当然可以,
只要是你喜欢用Python
(互联网、金融、医疗、保险、生态、统计、银行、通信、环境、证券、基金、科研都适用)
,一切都欢迎。。。
此外,参与会议的都还可以申请工信部的
《数据挖掘与分析应用高级工程师》
职业技术水平证书。
表弟:超模君表哥,还有一个大问题:我很想参与,可是我没什么钱呀?!
超模君:这个你不用担心,你可以参与
雪晴数据网奖学金计划
(可直接登录雪晴数据网了解)
,可以直接减免大笔学费,甚至还可以免费学。
在职人员3200元/人,学生2500元/人。
还可以单独学习
爬虫技术
或
文本分析课程
,价格更优惠。
含会议注册费、资料费、场地费。食宿费用自理。
1.现场班老学员8折优惠
2.三人以上同时报名9折优惠
3.五人以上同时报名8折优惠
会议主题安排
第一天
|
案例一: 爬取
电影票房
数据,然后对数据进行整理汇总,可视化展示
案例二: 抓取各级行政区域的
天气数据
案例三: 从东方财富网抓取
基金数据
案例四: 抓取
土地流转数据
案例五: 抓取历届政府工作报告,并绘制
词云图
案例六: 抓取全国
土地交易数据
案例七: 抓取北京交通委公布的
交通指数
案例八:
批量下载
上交所上市公司公告
|
第一讲
Python环境的搭建与基础语法
|
1. 安装anaconda套件
2. Jupyter Notebook的使用
3. 基本数据结构(列表、字典、元组)
4. 基本语法(条件、循环、函数、类)
|
第二讲
数据导入导出、数据整理与变换
|
1. 使用Pandas库导入/导出数据
2. 使用Pandas筛选、整理数据,分组汇总
3. 数据变换,重编码
|
第三讲
可视化与描述性统计
|
1. 饼图、柱形图、折线图、箱线图
2. 列联表与马赛克图
3. 文本的词云图
|
第四讲
Python爬虫技术初步
|