专栏名称: 大数据D1net
大数据D1net隶属于企业网D1Net,提供大数据存储、大数据分析、大数据挖掘等有关大数据的最新技术和资讯。
目录
相关文章推荐
数据派THU  ·  李飞飞巴黎演讲:如果 AI ... ·  2 天前  
CDA数据分析师  ·  【干货】2小时用AI完成的SQL教程也太赞了 ... ·  3 天前  
CDA数据分析师  ·  Deepseek来袭,数据分析师会失业吗? ·  2 天前  
数据派THU  ·  DeepSeek背后的技术基石:DeepSe ... ·  3 天前  
51好读  ›  专栏  ›  大数据D1net

加快数据科学项目的五个自动化工具

大数据D1net  · 公众号  · 大数据  · 2019-09-19 13:40

正文

点击上方“ 蓝色字体 ”,选择 “ 设为星标

关键讯息,D1时间送达!



数据科学影响了来自不同行业的许多企业。 尽管数据科学已经成为“21世纪最吸引人的工作”,但还有一项技术正变得越来越突出。


如今,自动化不仅应用于机器人领域,它还与其他领域相结合,使技术人员的工作变得更容易,其中一个领域就是数据科学。 有很多公司正在为数据科学领域开发工具和产品。 在本文中,我们将研究数据科学专业人员可以使用的一些自动化工具。



1. Auto-Weka


有几种机器学习算法可以直接使用,其中许多方法都是在Weka包中实现的。 然而,每一种ML算法都有自己的超参数,这些超参数可以极大地改变它们的性能,而且总体上有大量可能的替代方法。


Auto-WEKA最初于2013年发布,它考虑通过同时选择学习算法和设置超参数来解决这个问题。 它还解决了使用贝叶斯优化的问题。 Auto-Weka还致力于帮助非专业用户更有效地识别适合其应用程序的ML算法和超参数设置。


2. Darwin


Darwin是一家建立人工智能系统以推动最重要利益的公司Sparkcognition开发的,是另一个大规模解决数据科学问题的工具。 它是一种自动化的模型构建工具,允许用户在比传统方法更短的时间内从数据到模型。 此外,它还可以实现场景的快速原型设计和高效的洞察力提取。


这个工具是如何工作的?该工具使用基于神经进化的方法,自定义构建模型架构,以确保最适合目前的问题。


3.DataRobot自动机器学习


DataRobot是一个先进的企业AI平台。 该平台融合了一些世界领先的数据科学家的知识、经验和最佳实践。 谈到自动化,DataRobot的自动化机器学习平台,帮助ML开发人员以前所未有的透明度自动创建机器学习模型,以帮助理解和信任他们所做的预测。 该平台配备了不同类型的回归技术,从最简单的统计经典回归模型到复杂的统计经典回归模型。 此外,这个平台最好的一点是,它还可以解决多达100个不同类别的简单问题。


从一开始,DataRobot就一直是数据科学专业人士追捧的平台。 要了解这个平台的更多信息,您可以查看他们的官方产品网站。


4. H20.ai


在机器学习自动化方面,H2O已经成为领导者。 它是一个开源的分布式内存机器学习平台,具有线性可伸缩性。 该平台的创建方式支持大多数广泛使用的统计和机器学习算法。


这个平台最棒的地方之一是,它具有业界领先的AutoML功能,可以自动运行所有算法及其超参数,生成排行榜的最佳模型。


5. dotData


特性工程被认为是数据科学专业人员最重要、最耗时和最具挑战性的工作之一。 打包了最好的人工智能功能的dotData致力于将其自动化。 简单地说,该公司只专注于民主化和自动化整个数据科学工作流。


与传统流程相比,在识别用例到将流水线投入生产之间可能需要数月时间,此AI / ML平台有助于快速,大规模地执行复杂的数据科学项目。


(来源: IT168)


如果您在企业IT、网络、通信行业的某一领域工作,并希望分享观点,欢迎给企业网D1Net投稿 投稿邮箱:[email protected]

点击 蓝色 字体 关注

您还可以搜索公众号 “D1net”







请到「今天看啥」查看全文