专栏名称: AI前线
我们专注大数据和机器学习,关注前沿技术和业界实践。每天发布高质量文章,技术案例等原创干货源源不断。同时有四千人的社群微课堂,每周一次业界大牛技术分享,也希望你能从这里分享前沿技术,交流深度思考。
目录
相关文章推荐
数据派THU  ·  综述 | ... ·  13 小时前  
CDA数据分析师  ·  【干货】如何进行目标用户分析? ·  3 天前  
CDA数据分析师  ·  【干货】如何通过逻辑树分析法快速拆解和分析 ·  4 天前  
数据派THU  ·  RAPTOR:多模型融合+层次结构 = ... ·  1 周前  
51好读  ›  专栏  ›  AI前线

MapD GPU数据库开源了

AI前线  · 公众号  · 大数据  · 2017-05-14 12:44

正文

     MapD Technologies 将 MapD Core 数据库发布到了开源社区。MapD 是使用图形处理单元(GPU)以毫秒为单位分析数十亿行数据的先驱,比传统的基于 CPU 的数据库快几个数量级。

近日,据美联社官网报道,MapD Technologies 将 MapD Core 数据库发布到了开源社区。MapD 是使用图形处理单元(GPU)以毫秒为单位分析数十亿行数据的先驱,比传统的基于 CPU 的数据库快几个数量级。MapD Core 数据库及其可视化库开源让每个人都可以使用这个世界上最快的分析平台。

Todd 是 MapD Technologies 创始人兼首席执行官,据其博客介绍,他们在 5 年前开始 MapD 项目时就一直希望将其开源,当时没有那么做,是因为他们希望等代码库成熟。现在,他们注意到,整个 GPU ML 和深度学习技术栈都是开源的,但却没有一个开源的数据处理引擎。开源 MapD Core 数据库就是为了填补这项空白。开源让他们可以和生态系统的其他部分整合。同时,他们还宣布,和 Continuum Analytics 及 H2O.ai 成立了 GPU Open Analytics Initiative(GOAI),并公布了第一个项目 GPU Data Frame(GDF)。该项目可以实现数据在 GPU 进程之间的高效交换,而且避免了复制数据的开销。

此次开源包含如下内容:

  • MapD Core 开源数据库——MapD Core 数据库源代码遵循 Apache 2 许可协议,提供了 SQL 查询多 GPU 加速所需要的一切;

  • MapD 可视化库——MapD 提供了开源的 JavaScript 库,让用户可以构建基于 MapD Core 数据库的定制化 Web 可视化应用。该库包含生成图表、交叉筛选数据及管理 MapD Core 数据库连接的功能。其中,图表和交叉筛选库基于流行的 Dimensional Charting 项目(DC.js )。

同时,他们还公布了 MapD 分析平台企业版,其中包括 MapD Core 数据库、MapD Core GPU 渲染引擎及 MapD Immerse 可视化分析客户端。它还提供了开源版本不具备的分布式扩展、高可用(HA)、LDAP 及 ODBC 特性。他们的路线图上还有其他后续会增加到企业版的特性,尤其是在安全方面。

此外,MapD 还发布了一个社区版本,供非商业开发和学术使用。MapD 社区版遵循非商业性的学术许可,包含 MapD Core 数据库、GPU 渲染引擎及 MapD Immerse 可视化分析客户端。

这一消息引起了广泛的反响。New Enterprise Associates 投资合伙人 Greg Papadopoulos 表示:

一个开源的 GPU 数据库将会让全新的应用程序成为可能,尤其是在机器学习方面,GPU 在这方面的影响是如此之大。和 MapD 合作,我们非常自豪,因为它迈出了关键的一步。

加州大学教授 John Owens 则表示:

我的研究小组主要是针对并行计算设备,尤其是 GPU,开发更快的算法。一段时间以来,MapD 正在做的工作给我们留下了深刻的印象,只是希望我们可以在研究中把它作为真实世界的测试平台。现在,他们开源了自己的数据库产品,我们的团队很高兴将其作为研究平台,并向其代码库做贡献。

DGX Systems NVIDIA 总经理 Jim McHugh 认为,MapD 开源 Core 数据库的决定意义重大,它进一步激励了本来就已经很活跃的 GPU 分析社区。

要了解更多信息,请点击这里。感兴趣的读者也可以加入官方论坛。