专栏名称: 朝阳35处
互联网金融大数据挖掘哪家强,平安前海征信帮你忙。分享数据挖掘和人工智能前沿技术,探讨其在风险控制、反欺诈等金融业务中的实际应用。每周涨点知识,多点谈资,定期举办行业沙龙。
目录
相关文章推荐
新京报评论  ·  被滥用的“增肌神药”,不能游离在法律之外 ... ·  13 小时前  
新京报评论  ·  企业拥抱DeepSeek,顺应大势但也别盲目 ... ·  昨天  
CHINADAILY  ·  Top News丨US' ... ·  昨天  
51好读  ›  专栏  ›  朝阳35处

【算法】机器学习和数据科学最常用到的TOP10算法

朝阳35处  · 公众号  ·  · 2018-04-17 10:59

正文

本文翻译自:

http://businessoverbroadway.com/top-machine-learning-and-data-science-methods-used-at-work

数据科学的实践,需要使用算法和数据科学方法,来帮助数据专业人员从数据中提取洞察力和价值。Kaggle最近的一项调查显示,数据专家在2017年比其他数据科学方法更多地使用数据可视化、逻辑回归、交叉验证和决策树技术。展望2018年,数据专业人员对学习深度学习(41%)最感兴趣。


Kaggle于2017年8月对16,000多名数据专业人员进行了调查。 他们的调查包括数据科学,机器学习,教育等方面的各种问题。 Kaggle发布了原始调查数据,根据这些调查数据,我发现一些有趣的东西。今天的文章是关于2017年数据专业人员使用的数据科学和机器学习方法,以及2018年最令他们兴奋的机器学习/数据科学方法。



1. 2017年最受欢迎的数据科学/分析工具,技术和语言




调查包括一个针对数据专业从业人员的问题,“在工作中,你经常使用以下数据科学方法? (选择所有使用的)”。平均而言,数据专家在2017年使用了5种(中值)数据科学方法。2017年使用的前5种数据科学方法是(见图1):


  1. 数据可视化(49%)

  2. Logistic回归(42%)

  3. 交叉验证(38%)

  4. 决策树(36%)

  5. 随机森林(34%)

  6. 时间序列分析(31%)

  7. 神经网络(28%)

  8. PCA和维度降低(27%)

  9. kNN和其他聚类算法(26%)

  10. 文本分析(25%)


对于自称为“数据科学家”的数据专业人员,这些方法的使用率更高。这些数据科学家的采用率大约高出15-20个百分点(例如,66%用于数据可视化,61%用于逻辑回归, 56%为决策树,56%为随机森林)。


KDNuggets最近的一项调查发现,与目前的研究结果类似。在他们的研究中,顶级数据科学和机器学习方法还包括回归(60%),聚类(55%),可视化(51%),决策树/规则(51%)和随机森林(46%)。


2. 哪些 2018年学习最为兴奋的 机器学习和数据科学方法?






另一个 调查是,所有数据专业人士(不管是否正在工作),了解他们在下一年最兴奋的机器学习/数据科学方法。结果显示,数据专业人员对深度学习最感兴趣:


  1. 深度学习(41%)

  2. 神经网络(13%)

  3. 时间序列分析(6%)

  4. 贝叶斯方法(5%)

  5. 文本挖掘(5%)







请到「今天看啥」查看全文