数据分析重要性
越来越多的管理者意识到数据分析对经济发展、企业运营的重要意义
现在,得大数据者得天下
我总结的数据分析五步走:
1、锁定分析目标,梳理思路,叫纸上谈兵;
2、把杂乱的数据整理出图表报表,用数据探业务,叫自问数答;
3、锁定核心抓重点,设定最终算法,叫挟天子以令诸侯;
4、梳理重点发现,准备剧本开拍,接受PK,叫才辨无双;
5、效果梳理,总结经验,叫内视反听。
知道了数据的重要性,也了解了数据分析的步骤,那么如何更好的学习并运用呢
现在学习的途径很多,数据君整理几个大家不知道的网站,让你开开眼界:
都是国外的学习站点,所以有时候打不开,原因你懂的
一、如何用R的处理大数据
http://www.xmind.net/m/LKF2/
二、R语言的工具包
https://cran.r-project.org/web/views/
里面含机器学习,自然语言处理,时间序列分析,空间信息分析,多重变量分析,计量经济学,心理统计学,社会学统计,化学计量学,药物代谢动力 等
三、帮你获得python大数据处理工具大全
http://www.xmind.net/m/WvfC
四、学习Python语言的,个人强烈推荐
https://learnpythonthehardway.org/book/
说实话Python最近今年太火了,静下心学这个语言没有错!
五、SAS图例集
http://robslink.com/SAS/Home.htm
用SAS也可以做出很漂亮的图形,这里就要提到一位大牛:Robert Allison。在他的网站上给出了非常全面的SAS图例和相应的实现代码
六、美国布朗大学概率和统计的可视化导论,一个非常棒的可视化概率及统计的学习网站(http://students.brown.edu/seeing-theory/?vt=4)
七、教你玩动态的GIF图表
http://lenagroeger.com/
教你如何把手中的数据变成炫酷的GIF动图? 这个网站有各种类型的GIF图
八、如何选择机器学习算法
http://blogs.sas.com/content/subconsciousmusings/2017/04/12/machine-learning-algorithm-use/
九、一套数据,25种可视化
http://flowingdata.com/2017/01/24/one-dataset-visualized-25-ways
仔细看了一下受益匪浅,同一组数据做出来的效果不同,看数的角度也不同
十、大数据数据处理资源
http://usefulstuff.io/big-data/
从框架、分布式编程、分布式文件系统、键值数据模型、图数据模型、数据可视化、列存储、机器学习等
十一、里面蕴含编程语言、机器算法、大数据等,内容巨丰富
https://www.analyticsvidhya.com/blog/2017/02/top-28-cheat-sheets-for-machine-learning-data-science-probability-sql-big-data/
十二、推荐排名前50个开源的Web爬虫
十三、学习数据挖掘、机器学习的好网站,写的很全面很系统,适合各个级别的高手(网站:https://www.autonlab.org/tutorials)
一、数据分析师有哪些要求?
1、理论要求及对数字的敏感性,包括统计知识、市场研究、模型原理等。
2、工具使用,包括挖掘工具、数据库、常用办公软件(excel、PPT、word、脑图)等。
3、业务理解能力和对商业的敏感性。对商业及产品要有深刻的理解,因为数据分析的出发点就是要解决商业的问题,只有理解了商业问题,才能转换成数据分析的问题,从而满足部门的要求。
4、汇报和图表展现能力。这是临门一脚,做得再好的分析模型,如果不能很好地展示给领导和客户,成效就大打折扣,也会影响到数据分析师的职业晋升。
二、请把数据分析作为一种能力来培养
从广义来说,现在大多数的工作都需要用到分析能力,特别是数据化运营理念深入的今天,像BAT这样的公司强调全员参与数据化运营,所以,把它作为一种能力培训,将会让你终生受益。
三、从数据分析的四个步骤来看清数据分析师需具备的能力和知识:
数据分析的四个步骤(这有别于数据挖掘流程:商业理解、数据理解、数据准备、模型搭建、模型评估、模型部署),是从更宏观地展示数据分析的过程:获取数据、处理数据、分析数据、呈现数据。
(一) 获取数据
获取数据的前提是对商业问题的理解,把商业问题转化成数据问题,要通过现象发现本质,确定从哪些纬度来分析问题,界定问题后,进行数据的采集。此环节,需要数据分析师具备结构化的思维和对商业问题的理解能力。
推荐书籍:《金字塔原理》、麦肯锡三部曲:《麦肯锡意识》、《麦肯锡工具》、《麦肯锡方法》
工具:思维导图、mindmanager软件
(二) 处理数据
一个数据分析项目,通常数据处理时间占70%以上,使用先进的工具有利于提升效率,所以尽量学习最新最有效的处理工具,以下介绍的是最传统的,但却很有效率的工具:
Excel:日常在做通报、报告和抽样分析中经常用到,其图表功能很强大,处理10万级别的数据很轻松。
UltraEdit:文本工具,比TXT工具好用,打开和运行速度都比较快。
ACCESS:桌面数据库,主要是用于日常的抽样分析(做全量统计分析,消耗资源和时间较多,通常分析师会随机抽取部分数据进行分析),使用SQL语言,处理100万级别的数据还是很快捷。
Orcle、SQL sever:处理千万级别的数据需要用到这两类数据库。
当然,在自己能力和时间允许的情况下,学习新流行的分布式数据库及提升自身的编程能力,对未来的职业发展也有很大帮助。
分析软件主要推荐:
SPSS系列:老牌的统计分析软件,SPSS Statistics(偏统计功能、市场研究)、SPSS Modeler(偏数据挖掘),不用编程,易学。
SAS:老牌经典挖掘软件,需要编程。
R:开源软件,新流行,对非结构化数据处理效率上更高,需编程。
随着文本挖掘技术进一步发展,对非结构化数据的分析需求也越来越大,需要进一步关注文本挖掘工具的使用。
(三) 分析数据
分析数据,需要用到各类的模型,包括关联规则、聚类、分类、预测模型等,其中一个最重要的思想是对比,任何的数据需要在参照系下进行对比,结论才有意义。
推荐的书籍:
1、《数据挖掘与数据化运营实战,思路、方法、技巧与应用》,卢辉着,机械出版社。这本书是近年国内写得最好的,务必把它当作圣经一样来读。
2、《谁说菜鸟不会数据分析(入门篇)》和《谁说菜鸟不会数据分析(工具篇)》,张文霖等编着。属于入门级的书,适合初学者。
3、《统计学》第五版,贾俊平等编着,中国人民大学出版社。比较好的一本统计学的书。
4、《数据挖掘导论》完整版,[美]Pang-Ning Tan等着,范明等翻译,人民邮电出版社。
5、《数据挖掘概念与技术》,Jiawei Han等着,范明等翻译,机械工业出版社。这本书相对难一些。
6、《市场研究定量分析方法与应用》,简明等编着,中国人民大学出版社。
7、《问卷统计分析实务—SPSS操作与应用》,吴明隆着,重庆大学出版社。在市场调查领域比较出名的一本书,对问卷调查数据分析讲解比较详细。
(四) 呈现数据
该部分需要把数据结果进行有效的呈现和演讲汇报,需要用到金字塔原理、图表及PPT、word的呈现,培养良好的演讲能力。
推荐书籍:
1、《说服力让你的PPT会说话》,张志等编着,人民邮电出版社。
2、《别告诉我你懂ppt》加强版,李治着,北京大学出版社。
3、《用图表说话》,基恩。泽拉兹尼着,马晓路等翻译,清华大学出版社。
(五) 其他的知识结构
数据分析师除了具备数学知识外,还要具备市场研究、营销管理、心理学、行为学、产品运营、互联网、大数据等方面的知识,需要构建完整广泛的知识体系,才能支撑解决日常遇到的不同类型的商业问题。
推荐书籍:
1、《消费者行为学》第10版,希夫曼等人着,江林等翻译,中国人民大学出版社,现在应该更新到更高的版本。
2、《怪诞行为学》升级版,艾瑞里着,赵德亮等翻译,中信出版社
3、《营销管理》,科特勒等着,梅清豪翻译,格致出版社和上海人民出版社联合出版
4、《互联网思维—独孤九剑》,赵大伟主编,机械出版社
5、《大数据时代—生活、工作与思维的大变革》,舍恩伯格等着,周涛等翻译,浙江人民出版社
四、关于数据分析师的职业发展:
1、数据分析师通常分两类,分工不同,但各有优势。
一类是在专门的挖掘团队里面从事数据挖掘和分析工作的。如果你能在这类专业团队学习成长,那是幸运的,但进入这类团队的门槛较高,需要扎实的数据挖掘知识、挖掘工具应用经验和编程能力。该类分析师更偏向技术线条,未来的职业通道可能走专家的技术路线。
另一类是下沉到各业务团队或者运营部门的数据分析师,成为业务团队的一员。他们工作是支撑业务运营,包括日常业务的异常监控、客户和市场研究、参与产品开发、建立数据模型提升运营效率等。该类型分析师偏向产品和运营,可以转向做运营和产品。
2、数据分析师的理想行业在互联网,但条条大道通罗马,走合适你的路线。
从行业的角度来看:
1)互联网行业是数据分析应用最广的行业,其中的电商企业,更是目前最火的,而且企业也更重视数据分析的价值,是数据分析师理想的成长平台。
2)其次是咨询公司(比如专门的数据挖掘公司Teradata、尼尔森等市场研究公司),他们需要数据分析人才,而且相对来说,数据分析师在咨询公司成长的速度更快,专业也会更全面。
3)再次是金融行业,比如银行和证券等行业,该行业对数据分析的依赖需求,越来越大。
4)最后是电信行业(中国移动、联通和电信),它们拥有海量的数据,在严峻的竞争下,也越来越重视数据分析,但进入这些公司的门槛比较高。
五、什么人适合学习数据分析?
这个问题的答案跟“什么人适合学功夫”一样,毫无疑问,功夫是适合任何人学习的(排除心术不正的人),因为能够强身健体。而功夫的成效,要看习武者的修炼深浅。常常有人争论,是咏春拳厉害,还是散打厉害,其实是颠倒了因果,应该看哪个人练习得比较好,流派之间没有高低,只有人修炼的厚薄。
实际上,问题的潜台词是“什么人学习数据分析,会更容易取得成功(比如职业成功)”,这个要视乎你的兴趣、付出和机遇。但要做到出类拔萃,除了上面三点,还需要一点天赋,这里的机遇是指你遇到的职业发展平台、商业环境、导师和同事。
借用管理大师德鲁克的话“管理是可以习得的”,管理并非是天生的,而数据分析能力,也可以后天提升。或许做到优秀,只需要你更加的努力+兴趣,而这个努力的过程,也包括你寻找机遇的部分。
六、关于如何学习:
学习方法千万种,关键是找到适合自己的,最好能够结合你的工作遇到的问题来学习。
1、搜集书籍、案例库和视频,先弄懂理论,然后学会软件操作,自己制作属于自己的教程。
比如,你学习聚类分析模型。1)搜集相关的聚类分析模型的书籍、案例和教学视频,了解聚类分析的原理,主要有哪几种算法(划分、层次、密度、网格)、模型适用的范围和前提、如何评估模型的精确度等。
2)自己学会用软件来实现。
3)总结整理成一份PPT和制作操作视频,成为自己的学习教程,不断完善。
4)学习到一定程度后,可以在博客、微信等渠道分享,授人与渔,而自己也会有所收获。
2、关注名人、名博、网站,多渠道学习。
1)关注专业的数据分析、咨询公司网站和论坛,特别强调,统计软件公司的网站如SPSS的官网有很多案例库,值得关注。
SPSS的案例库,可在官网上搜索各类案例:http://www.ibm.com/developerwork … 8zhangzy/index.html
另外,你最好建一个自己的网址导航目录,提升你的学习效率
2)关注名人名博,最好能加他们的微博、微信和微信公众号,看牛人的博客和微信等内容,还是能得到很多引导,这个你懂的。
3)加入一些有共同爱好的QQ群,互相学习交流。通常群里有人会提出一些真实的运营问题,然后大家用不同的方法去解决,对思路很有启发。
4)碎片化学习,最大化你的时间价值。为了把零散的时间利用起来,通常我会把一些资料上载到网盘,在零碎的时间里通过手机进行视频、文档学习等。目前使用百度云盘和360网盘。百度云盘应用比较广,通常在网络上搜索“关键词+百度云”后,搜到结果可以直接保存在云盘上,搜索保存速度极大提升。360网盘则空间比较大,可以到达40T,同时有保险箱加密功能,安全性高一些。
手机上安装一些APP,随时随地学习。
七、最后的建议
请再次问问自己,是否真的喜欢数据分析,能否忍受处理数据时的寂寞?如果是,那就开始学习,给你几条建议。
1、把数据分析作为一种能力培养,让自己在现在的团队中展现出良好的数据分析能力,为你以后内部转岗做好准备。如果内部转岗不成,你可以考虑跳槽到我之前分析的行业中,但我强烈建议你还是需要把系统开发的编程能力学习好,并且对商业智能系统(BI和CRM)有一定了解,这也许是应聘数据分析的优势。如果没有数据分析经验去应聘,相对会难一些,用人单位会考你统计和数据挖掘模型方面的知识,以及工具使用情况。
2、在公司里找一些有共同爱好的同事一起学习数据分析,平时多请教数据分析做得好的同事,它山之石,可以攻玉。
3、扎实学好一、两门数据挖掘软件,基于你有编程的基础,建议你可以学SAS或者R,同时辅助学习SPSS Modeler。如果没编程基础或者希望短期能够取得成效,那也可以先学习SPSS。SAS+SPSS,基本能够满足很大部分企业的需求,三者都会,那更好。
4、要了解公司是如何运营,产品是如何开发的,如何做客户研究锁定客户需求,如何做产品营销,这些需要不断工作积累和广泛的阅读。
5、开始学习时,先读几本有趣的数据分析类的书,然后系统学习一下统计知识(建议教材用《统计学》第五版,贾俊平等编着),接着网上快速搜集软件操作视频和案例,然后逐个分析模型进行学习和总结归纳,学习最好能够结合实际工作中的问题进行。
6、学习到一定程度时,参加一些数据分析师的职业认证,进一步梳理知识结构,同时认识一些志同道合的朋友和老师,也是对你有很大帮助。
为了鼓励新工具的出现,机器学习和数据分析领域似乎已经成了“开源”的天下。Python 和 R 语言都具有健全的生态系统,其中包括了很多开源工具和资源库,从而能够帮助任何水平层级的数据科学家展示其分析工作。
机器学习和数据分析之间的差异有些难以言明,但二者最主要的不同就在于,比起模型的可解释性,机器学习更加强调预测的准确性;而数据分析则更加看重模型的可解释性以及统计推断。Python ,由于更看重预测结果的准确性,使其成为机器学习的一把利器。 R ,作为一种以统计推断为导向的编程语言,在数据分析界也得到广泛应用。
当然,这并不代表二者只能在各自的一个领域中得到应用。Python 也可以高效地完成数据分析工作,R 在机器学习中也具有一定的灵活性。它们都拥有相当多的资源库去实现彼此特定的函数功能,比如 Python 就有很多资源库来提高自己统计推断的能力,R 也有很多包可以提升预测的准确率。
Python 中关于机器学习和数据分析的包
虽然 Python 本身就更倾向于机器学习, 但它还是有很多包可以进一步优化这一属性。PyBrain 是一个模块化的机器学习资源库,其中包含很多有效的算法可以满足机器学习任务的需要。除了很多直观灵活的算法,这个资源库还内置很多环境可以用来检验和比较这些机器学习算法的效果。
Scikit-learn 可能是 Python 最受欢迎的机器学习资源库了。基于 Numpy 和 Scipy ,scikit-learn 提供大量用于数据挖掘和分析的工具,从而提高了 Python 本就出色的机器学习可用性。NumPy 和 SciPy 各自为战,虽然它们是 Python 中数据分析的核心部分,但数据分析家更可能仅仅原生地去使用它们,而不是基于一个更高的角度。 Scikit-learn 却将二者结合成为一个机器学习资源库,同时也降低了大家的学习门槛。
在数据分析领域,Python 也因几个库而包受推崇。 作为其中最为著名的库之一,Pandas 为 Python 提供了高性能处理的数据结构和数据分析工具。如同其他很多 Python 的库一样,从你着手一个新项目到真正做些有价值的工作这过程的时间将会因它大大缩短。如果你执着于 Python 同时又希望使用 R 的功能, RPy2 库能够提供所有 R 的主要功能,并给你一个 R 在 Python 中使用的流畅化体验。
R 中关于机器学习和数据分析的包
就像 Python 一样,R 也拥有大量的包来提升它的表现。要想在机器学习领域媲美 Python,R 中的 Nnet 包具有快速构建神经网络模型的能力。通过提供一系列函数来提升所构建模型的有效性,Caret 包也可以加强 R 在机器学习的能力。
就 R 在数据分析领域的表现,仍然有很多包可以用来提升它本就出色的能力。不管是建模前的准备,建模,以及建模后的分析工作,R 都有很多包可以胜任。这些包大多专门用来完成特定的任务,比如数据的可视化,连续变量回归和模型验证。
两种编程语言都拥有如此多交叉功能的资源库和包,你会选择哪种编程语言作为伴你在数据战场厮杀的武器呢?
在机器学习和数据分析中的 Python
如果你已经有一些编程的基础了,Python 可能更加适合你。相较于 R ,Python 的语法结构与其他编程语言更加类似,便于上手。此外,就像是口头语一样, Python 代码的可读性也是无人能及的。这种代码的可读性更加强调提高生产力,而 R 非标准的代码可能会导致在编程进程中的磕绊。
Python 是一种很灵活的编程语言,所以如果你打算把已经完成的机器学习或者数据分析的项目移植到其他领域,那么使用 Python 可以使你不必再去学习新的编程语言。
Python 的灵活性也使得它非常适用于生产。举个例子,当数据分析的任务需要与 Web 应用程序相整合的时候,你仍然可以使用 Python 且不需要和其他编程语言相整合。而虽然 R 是一个很好的数据分析的工具,但它在数据分析之外的领域却有所限制。
如果你刚入门编程,对那些“标准化”的语法并不熟悉,那么无论哪种编程语言的学习曲线对你而言都差不多。但要是你希望跨过机器学习和数据分析的门槛,Python 可能是更好的选择。特别是 Python 有 scikit-learn 库的加持。这个库表现良好且更新频繁。 R 可能有很多包,但显得有些零乱且一致性较差。
在机器学习和数据分析中的 R
目前, R 主要是用在科研和调查工作中。然而,随着 R 逐渐扩展到商业领域,这一现状也开始得到改变。 R 是由统计学家所创造出来的,因此它可以很轻易地管理基本的数据结构。给数据打标签,填充缺失值,筛选等等这些对于 R 而言很容易就可以实现,R 也更加强调易于操作的数据分析,统计和图形化模型工作。
由于 R 是作为统计性的编程语言而构建的,因此它具有很好的统计方面的支持。它能够很好地展现统计学家的思维,所以如果你具有统计背景的话,用起来会很顺手。诸如像 statsmodels 包能够基本覆盖 Python 中的统计模型,而且 R 中与统计模型相关的包功能会更加强大。对于刚入门的程序员, R 只需要写几行代码就能够构建模型了,这样一来,它会比 Python 更容易解释一些。
R 中与 Python 的 pandas 库功能最为接近的大概就是 dplyr 包了,只不过它会比 pandas 库限制得更多。虽然这听起来不太好,但实际上使用 dplyr 包时会促使你更专注于寻求问题的解决之道,而且 dplyr 包的代码也比 pandas 库更容易理解。
选择你自己的编程语言吧
R 最大的问题在于一致性不够好。其中的算法流程被分成三块,使得它们相对而言不够统一。你不得不学习新的方法来建模并用新的算法来做预测,伴随这个过程,结果的有效性将会明显下降。你需要理解每个包是怎么用的,同样地,R 中包的帮助文档由于不够完整,一致性也不好。
不过,要是你需要一个数据分析的工具用于学术, R 绝对可以胜任这项工作。 Python 则被广泛地用于商业也更便于协作,不过 R 也越来越得到重视了。不管是日常的使用和机器学习,还是通过和 R 一般众多的包来做数据分析, Python 都能做到,因此也更推荐使用 Python 。
如果你对 R 还比较陌生,不如学习 Python 并通过 RPy2 包来实现 R 的功能。 这样一来,你就可以在一种编程语言里同时使用二者的功能,而且由于很多公司已经开发了在 Python 中使用的生产系统, Python 可谓生产力高效。这点在 R 中就不适用了。一旦你学会了 RPy2 ,再想跳到 R 里面并没有那么复杂,不过反过来就相对而言困难得多了。
不管你想解决什么类型的问题, Python 和 R 都有功能相近的资源库可以使用。每种编程语言都有很多的分支、模块、集成开发环境和算法,以至于你难以出什么大的纰漏。不过要是你希望使用一个灵活性强,扩展性好,多功能又能胜任机器学习和数据分析工作的编程语言, Python 或许是明智之选。
原文链接:Python versus R for machine learning and data analysis
原文作者: Tom Radcliffe
译作者:Vector via:数据工匠
End.
作者:Bob Muenchun
前言
招聘广告的数量能一定程度上反应每一种软件的流行程度,并从中预测出哪一种在将来会更加流行。本文作者以美国最大的招聘网站Indeed.com为统计平台,通过对某一天数据科学职位的招聘数量进行统计分析,得出数据科学软件的变化趋势。
为了公平,本文采用了一种专门的方法,用来在数据科学职位范围内统计每种软件的招聘数量,文中所有的图片也都是在这个前提下取得的,统计日期为2017年2月24日。
正文
各种软件招聘量见下图。其中最多的是SQL,将近18000,然后分别是Python和JAVA(13000左右),Hadoop(10000左右),R,C系列和SAS(这是R首次在在数据科学职位报告中超过SAS),Apache Spark,Tableau(5000左右,限数据科学职位),Apache Hive(3900左右),Scala,SAP,MATLAB,SPSS。其中Scala,SAP,MATLAB,SPSS均为2500左右。
招聘量小于250的软件列在了下图中,分别是:Alteryx(240),Microsoft(Azure Machine Learning and Microsoft Cognitive Toolkit,157),Julia,FORTRAN,Apache Flink(125),H2O(100)。以操作容易为卖点的SAS Enterprise Miner、RapidMiner和KNIME招聘量都是90左右,大概是因为各公司认为没有必要聘请专家?SPSS模块也是同样类型的接口,但却只有50个职位。开源的MXNet深度学习框架有34个职位,而Tensorflow是它的12倍,但是两者都很年轻,有足够大的潜力在未来快速发展。
下面我们先来看一下R是如何超过SAS的。从下图可以看出,在2012年到2017年2月28日这个时间段,SAS的职位需求一直都很稳定,而R则稳定增长并最终在2016年早期超过了SAS。另外根据blog post所述,R于2015年就已经在学术出版物中超过SAS。
再来看一下Python和R。Python和R谁更流行的争论是由来已久,但是从来都没有多少数据支持。但是单从招聘职位上来看,Python于2013年就已经超过了R(如下图)。当然我们要清楚,R只是单纯用来进行数据分析,而Python在数据科学领域用途更广泛。
End.
大数据的概念越来越热,很多人,包括大学生和一些年轻职员,都希望能为自己充充电,向大数据方向转型,为了迎合这种需求,网上也出现了越来越多的专业网站,我在这里根据一年多来的观察为大家总结出十个最专业的学习网站,供大家参考哈。 另外本文为各大网站进行的排序考虑的是课程的专业性,比如ppv课排到统计211前边并不是说ppv课就比统计211有名气什么的,统计211的论坛做的绝对比ppv课好,但是本文主要考量的是网站提供的课程。希望能给大家提供几个可以系统学习大数据的网站。另外,现在这类网站真的太少了,希望可以再接再厉,涌现出更多的优秀网站。
第八名:网易公开课
http://c.open.163.com/search/search.htm?query=统计#/search/all
权威性:10分。网易公开课提供的视频都来自各个国际知名高校,当然权威啦。 专业性:6分。刚刚接触大数据的朋友不妨来看看相关的课程,它当然一点也不专于大数据,但是如果知道方法的话,还是能搜到一些不错的视频的。 活跃性:10分。更新速度让你吃惊。
网站课程:8分。它所提供的课程都非常基础,还是那句话,如果你初次接触某个领域,不妨来网易公开课上看看视频,不过很快它就不能满足你啦。
七:Peixun.net
http://www.peixun.net/video/
权威性:6分。一个新网站啦,貌似是人大经济论坛的下属网站,但是我还是得说权威性也就那样吧。 专业性:8分。这个网站本身很好,绝对没问题,但是考虑到它是为整个经济管理系服务的,so,范围就显得过于宽泛了,不过你想学大数据的话,还是个不错的选择。 活跃性:10分。课程更新相当及时。
网站课程:9分。这个网站提供的课程收费标准是一个月50块钱,全部课程随便看。想付费的同学一定要考虑清楚,啧啧,看它的视频真是啥类型都有,资源倒是不少,只是太乱了。强烈建议网站整理一下资源。
六:统计211
http://www.tj211.com/portal.php 权威性:8分。老牌网站,版主什么的都挺多的,也挺专业。是个好网站。 专业性:9分。偏向统计,有的医学统计,生物统计什么的也有,总体来说还是靠谱的。学大数据里统计方面的东西来这里没差。 活跃性:10分。用户很多,很活跃。 网站课程:8分。没找着相关图片。主要采用YY教学。它的课程有点乱,都不给排序的。另外怎么付费也有点乱糟糟的,可以充值,也可以自己在论坛上挣。 五:ppv课 http://www.ppvke.com/
权威性:6分。 ppv课是13年上线的互联网新贵,权威性难免有所欠缺。但考虑到其他方面,编编还是把它放到第五位了。我个人对这个网站寄予厚望。 专业性:10分+。专业性没问题。这个网站专精大数据,不像统计网站那样过于狭隘,也不像某些论坛那样过于宽泛。想转型大数据的朋友一定不能放过。尤其是刚刚接触这一行的朋友。 活跃性:7分。和中国统计网类似,网站本身活跃性不强,不过v博有天天更新,所以勉勉强强给个7分咯。
网站课程:10分+。 如上,这个网站本来做的就是培训,so,课程肯定10分+,它主打的是网络课程(据我所知,现在还是免费的),内容超级全面,刚入行的朋友一定不要错过。网站也有一些线下课程,貌似还比较少。
四:炼数成金
http://edu.dataguru.cn/
权威性:8分。前身是ITPUB论坛,创办者也蛮有名的,可以说比较权威吧。 专业性:10分。10分没问题呀。相关板块从统计到IT基础分的详细而全面,专业指数可以和ppv课比肩。 活跃性:10分+。忒阴险了,这个论坛办的课程里留的作业就包括在论坛里发言,你说他能不活跃吗啊?不过帖子还是比较专业的。
网站课程:10分+。课程采取的逆向收费法相当特别,一套课大概100块钱就听下来了,而且是互动类型的。课不算多也不算少,缺点是持续时间太长,基本都要十周以上,工作比较忙的人可能会适合这个学习,学生的话这个学习节奏就有点拖沓了。
三:CSDN论坛。
http://bbs.csdn.net/ 权威性:10分。 也是老牌子的网站了,计信院出来的很少有人不知道吧啊? 专业性:8分。 东西太多太杂了。许多都不是大数据领域的东西额。 活跃性:10分+。 一群婆婆嘴,整个天南海北的胡侃。而且它有配套博客,里边好东西真不少,搞技术的推荐去看一下。 网站课程:8分。课挺多的,都是现场班,而且不收费。是的,不收费。它其实是给高水平的同学提供交流的平台,当然也有老师哈。想上这个班需要自己申请(相当繁琐)。而且大数据方面的课不多,只有一个云计算比较靠谱,程序员出身的务必考虑。
二:统计之都
http://cos.name/
权威性:10分。 统计之都前身是人大经济论坛的一个子论坛。创始人以及版主大都是人大出来的,权威性不用说,10分! 专业性:10分。听它名字就知道绝对专业嘛。它是个统计论坛,不过大数据本来就包含统计的成分,而且论坛里边R方面的专家绝对是一流水平。 活跃性:10分。人气可以说是爆棚啊。版主都非常好,发贴很少有删掉的。必须赞一个。
网站课程:3分。教学视频寥寥无几。这个论坛是个公益论坛,完全就是一个大家交流的的平台。所以课程这方面。。。3分我都觉得有点高了。。。这个网站比较适合有一定基础以后来学习交流,结识朋友。至于想在这里来个彻底的升华什么的技术小白,还是醒醒吧。
一: 人大经济论坛 http://bbs.pinggu.org/
权威性:10分。 中国人民大学创办的论坛,权威性不容置疑,可以说是人才云集的网站。人大统计专业是全国第一,想学大数据,这个网站必须排第一。 专业性:8分。 太杂乱了,一个论坛整整分了十三个区,从经济管理到会计审计,内容过杂,专业评分只能给8分。 活跃性:10分。 作为一个老牌论坛,真的很活跃,许多专业问题都能在这里找到答案,提问往往能得到及时回复。很棒!(就是网站排版太难看了,乱糟糟的,网站有这么穷吗啊?请个美工也请不起,真不知道挣的钱都干嘛花了。) |
1、数据分析第一门户-数据熊猫论坛[dp论坛] http://www.datapanda.net/forum.php
由一群热爱数据行业的大学生在11年创立,内容更新快,资源涵盖面广,从数据分析软件学习,到数据资源分享等应有尽有,通过几年的发展,积累庞大的会员群,一起交流分享数据资讯。
2、数据分析精选: http://www.afenxi.com/
数据分析行业的”hao123”有了它一个就够了,按类别整理搜集所有相关数据行业的网站,非常实用!
3、人大经济论坛-计量经济学与统计区 http://www.pinggu.org/bbs/index.php?gid=148
业内人士都应该去过的门户,主要涉及计量经济学、统计学、数据挖掘、统计软件、数据等经济学相关问题交流统计软件交流
4、中国统计论坛 http://bbs.itongji.cn
属于中国统计网的交流论坛,中国统计论坛-BBS.iTongji.CN 提供统计软件,统计教程,统计年鉴,统计论文,统计资料下载,统计认证,培训就业资讯,技术文章学习等的专业数据分析技术论坛。
5、数据挖掘学习交流论坛 http://www.businessanalysis.cn/
统计软件CRM,Data Mining,Data analysis,SPSS,SAS,SAP ,数据挖掘学习交流论坛。
6、数据圈:http://www.shujuquan.com.cn/
数据圈论坛内容包含统计年鉴、统计公报、行业报告等数据资源的共享交流,SAS、EVEIWS、SPSS、STATA等数据软件的使用探讨、经济与管理相关学科的知识应用
7、EXCEL学习网:http://www.excelcn.com/
Excel学习网-公益型的EXCEL在线学习网站,助您轻松办公!
8、数据分析精选: http://www.afenxi.com/
数据分析行业的”hao123”有了它,按类别整理搜集所有相关数据行业的网站,非常实用!
9、数据挖掘研究院 http://www.chinakdd.com/
数据挖掘研究院,比较早的一个门户,内容比较丰富,但是欠系统性的整理,主要涉及一些工具的使用和算法的研究,有兴趣的可以去找找看。
10、S-PLUS、R统计论坛 http://www.magnsoftbi.com/forum/default.asp
是北京宏能畅然数据应用有限公司旗下的一个门户,专注于数据分析、数据挖掘与商业智能应用,S-PLUS和R软件的技术交流平台。
往期精彩回顾
【物理思维】物理学中十大最牛逼的思想实验!
【物理大师】“人情”“物理”彭桓武
【物理科技】这应该是全世界最有情调的智能蜡烛了,撩妹技能爆升
【物理之问】高楼坠人救还是不救?物理学家通过计算给出了答案
【天舟一号——实况观礼】感受中国大型卫星发射的超级震撼, 见证中国航天步入世界强国之列的历史时刻!
【趣味动图】涨知识的GIF图(很有趣很直观)
本期编辑|以太
环球物理,以物理学习为主题,以传播物理文化为己任。专业于物理,致力于物理!以激发学习者学习物理的兴趣为目标,分享物理的智慧,学会用物理思维去思考问题,为大家展现一个有趣,丰富多彩的,神奇的物理世界!
咨询电话:010-56143955 010-56143855
投稿请联系 [email protected]
地址:北京市海淀区苏州街名商大厦1101环球物理
参加物理集训营拨打咨询电话,短期高效提高物理!欢迎拨打咨询电话:13581994719