专栏名称: 铅笔道
铅笔道是不说谎的创投媒体,专注于原创真实报道,不卖广告、不卖软文、不卖培训、不做FA,报道对象主要为B轮融资前的早期创业者。
目录
相关文章推荐
产业互联网大视野  ·  2024年中国产业互联网最具发展潜力企业名单 ·  3 天前  
铅笔道  ·  2024就一件事:交朋友 ·  4 天前  
产业互联网大视野  ·  与5000家产业互联网企业约个饭!2024年 ... ·  6 天前  
51好读  ›  专栏  ›  铅笔道

他把半个机房浓缩进小盒子 用GPU将数据库处理性能提升100倍

铅笔道  · 公众号  · 科技投资  · 2017-07-09 09:29

正文

Zerone团队的每位成员都用超级英雄做代号。


| 铅笔道 记者 罗正臣


导语


你就叫我星爵好了,他是我最仰慕的超级英雄,也是我在团队里的代号。


2005年飞赴美国留学,4年后年进入Oracle公司,从事数据库项目12c核心研发工作,到2015年归国创业,这位创始人始终认为自己像漫威漫画中的星爵一样,在探索新世界。


去年4月,星爵组建起一支5人团队,研发一款基于GPU基础架构的新型OLAP数据库,取名Zerone。据星爵透露,该数据库与传统内存数据库相比,可以将数据处理性能提高30~100倍,同时降低10倍硬件成本、20倍计算能耗。


该项目已于去年4月完成天使轮融资,现阶段正在进行Pre-A轮融资中。



: 星爵承诺文中数据无误,为其真实性负责,铅笔道已备份录音速记,为内容客观性背书。

归国创业


星爵站在旧金山机场门口,手中握着飞回北京的机票,推着三只行李箱,回头看了一眼背后的蓝天白云,有那么一丝恋旧。


让他没想到的是,再一次回到美利坚,已是一年半之后。


自2009年从美国研究生毕业后,星爵从酷寒之地飞到了春暖花开的旧金山。在那里,他加入了Oracle 12c项目团队,负责云端多租户数据库的研发工作。“Oracle当时在做的项目让我感觉很有前瞻性,可以将数据库做成下一代云服务,诱惑很大。”


六年时间飞逝而过,随着12c项目迭代完成,星爵思考下一步职业发展方向。“Oracle产品研发周期是5年,我进去时刚好11g版本收尾,然后为12c做立项、调研工作。能够在这么大公司经历一个完整的产品迭代,我觉得没有遗憾了。”


就像他最喜欢的漫威英雄“星爵”始终坚信自己的征途应该在浩瀚星海,星爵在思考创业的可能。“在美十年间,我每年会回一次国。每次踏上国土都会感觉经济发展势头迅猛,尤其很多国内团队也在研发赶超欧美的技术,所以回国创业将是一次机会。”


话虽如此,但是回国前他还是经历了一番纠结和挣扎。当他面对着满屋杂乱的行李时,心里几次悄悄打了退堂鼓。“需要处理车、房子、家具等物品,心里容易烦躁。这时候就会跑到电脑跟前打一局英雄联盟,或是去做一些其他事情放松身心。”


终于在2015年5月,星爵义无反顾地站在了机场门口。飞机落地,他做的第一件事便是寻找同窗好友。 “我去美国读书时他就已经在硅谷工作了,我进入Oracle都工作结束了,他还在原公司就职,尽管待遇不菲,但是人生轨迹就像火车,始终是被设计好的。”


比起画饼的话语,星爵用数字打动了好友。“在OLAP数据库领域,全球市场份额约为每年190亿美元,预计在2020年可达到250亿美元规模。”而星爵想做一款基于GPU硬件,应用于人工智能的新一代OLAIP(On-line Analytical and Intelligent Processing)数据库系统——Zerone。

提升100倍性能


在星爵看来,基于GPU的OLAIP数据库很快将会取代传统OLAP数据库,原因在于CPU自身处理性能的局限性。“现在一块CPU最多几十个核,而一块英伟达的GPGPU(General Purpose GPU)可以内嵌五千多个计算核心,对于数据的分析处理能力不止上升了两个量级。”


而市场上现有的分布式处理技术,都是基于CPU架构研发的,“复杂的算法虽然可以提高数据库运算效率,但是就代码来讲不够简洁和优雅。GPU的发展正好迎合了自硬件层面提升数据库处理速度的需求。”


星爵想到,如果能够用一台以GPU为核心的集群代替传统机房和数据中心,就会将企业的硬件成本降低10倍,能耗降低20倍。“用一个可以放在桌上的小黑盒子和多服务器的大型机房做对比,当然是选择前者更划算。”


◆Nvidia GPU与CPU算力对比图


Zerone可以使用GPU的多处理核心进行超大规模并行数据处理。比之传统的分布式数据库需要分割提供数据存储、管理、分析环节,Zerone可以提供数据库和人工智能计算(Tensorflow、MXNet和Caffe等)之间的数据通道,将前述功能融为一体,在一个库中进行操作。“打通数据库分析流程后,数据工作者的效率可以提升70%以上。”


为了验证产品性能,星爵带领团队测试了2009年至2015年间纽约市11亿条出租车出行记录数据集。团队分别在一台双路E5-2683 v3 的CPU服务器上和一台4路GTX1080 GPU服务器上,同时运行了一系列数据分析查询SQL语言,结果显示Zerone的提速比在30倍~100倍之间。(Intel E5-2683 v3 CPU市场价格约为每块1000美金,Nvidia GTX 1080 GPU价格约为每块500美金。该测试系列测试旨在对比相同硬件价格下,不同OLAP性能的差异。)


同时在大洋彼岸,两家专注于研发GPU数据库的公司已经获得大额投资。成立于2013年的MapD公司,已于今年3月完成了B轮2500万美元的融资;成立于2009年的Kinetica已于今年6月完成5000万美元A轮融资。


谈及竞品,星爵表示Zerone可能是两家正在上升期公司的受益者。“大家在同一个领域开发,他们因为体量和融资数额巨大,会帮助我们教育市场。同时也可以让在国内的投资人看到该领域的发展前景,利于Zerone生存。”


但是星爵认为,比之前辈,他们在一个更为恰当的时间点切入了市场。“例如阿里云、腾讯云、百度云、AWS等云服务提供商在几乎同一时间推出了云端GPU 组件,方便创业公司获取底层硬件架构,降低了初期创业成本。”


去年4月,星爵的创业团队组建完毕,在5人队伍里有他的同窗好友(花名Groot),也有一位花名卡尔的少年黑客。“卡尔是Dota里面技能最多的英雄,他认为自己可以成为独当一面的英雄。”


今年3月,Zerone的产品原型研发完毕,星爵考虑如何将项目商业化。今年年末,基于Zerone的BI系统即将研发完毕,现阶段公司正在与一些硬件厂商做POC合作,其中不乏IBM、Nvidia等巨头公司。


在企业推广方面,团队将会联系垂直领域的渠道商,例如前文所述的系统服务提供商或软件行业解决方案提供商,从企业服务方向合作切入公有云市场,并为金融、电商、游戏等大型企业提供私有云部署。


现阶段,Zerone正在进行Pre-A轮融资。本轮资金将主要用于招揽人才及扩张团队。预计于今年年底,团队将会发展至20人,其中技术团队15人,市场、行政共5人。


编辑 薛  婷 校对 朱明驰


如需转载文章请联系铅笔道微信客服号铅笔道大芯芯(微信id:qianbidao2017)获取授权资质,否则我们将依法追究相关责任。


 阅读完莫急走
我是本文作者罗正臣,一只关注人工智能、大数据领域的北京土著,相关行业创业者或对口投资人,可加微信聊聊:497248875(加好友请注明公司、职位、事由哦)


长按识别图中二维码,或点击“阅读原文”,即可报名金芯A计划第一期【真格基金路演专场】。