专栏名称: YottaChain
YottaChain重定义区块链存储
目录
相关文章推荐
丁香园临床用药指南  ·  艾司奥美拉唑 vs ... ·  昨天  
桂林广播电视台飞扬883  ·  热播剧被吐槽太恶心!剧方火速删镜头 ·  13 小时前  
医药经济报  ·  研判:丙类目录的市场价值 ·  3 天前  
药物临床试验网  ·  分享 ▎临床试验中的几种光源 ·  3 天前  
51好读  ›  专栏  ›  YottaChain

YottaChain创始人王东临:从技术角度分析区块链存储的发展与落地

YottaChain  · 公众号  ·  · 2020-01-03 20:43

正文



本次分享由中关村大数据产业联盟联手BITCLUB联合举办,布洛克、天使城邦、3 1区、数据观等机构提供社群与传播支持,覆盖30+人数超过10000人的天使投资人社群及20+覆盖超过20000人区块链产业人士。


主题: 《区块链存储的发展与落地》

分享嘉宾: YottaChain创始人王东临

主持人: 中关村大数据产业联盟副秘书长颜阳


以下为分享内容实录

第一部分

区块链存储的定义及历史简介




前几天YottaChain全网上线仪式比较瞩目,主要因为这是超越美国的项目。

YottaChain的全网上线仪式有5个院士,中科院、北大、清华、南开的学术带头人,中央多个部委的领导出席,就是因为我们在存储核心技术上实现了历史性的突破。

中国在桌面存储时代是全军覆没的,所有的桌面存储系统,不管是FAT还是NTFS全都是国外的,连硬盘也全都是国外的。

在企业存储时代,中国有几十家国产存储厂商,有核心技术的也有几家,最好的能做到世界二流水平。企业级存储市场仍然被Dell/EMC、NetApp、HPE、IBM、HDS等所把持。连中国自己的银行也基本上清一色都是国外的核心存储,直到最近两年才有小银行开始尝试在核心业务上试用华为存储。

在云存储时代,各大巨头都投入巨资竞争,但世界一流也依然被AWS、Google、Microsoft所把持。阿里云在国内做得很好,但到了美国也只能定位于服务跟中国有业务的美国企业。

但到了区块链存储时代,现在产品技术是我们YottaChain排到第一,压倒了美国的IPFS/FileCoin,算是实现了中国存储人几十年的一个夙愿。






第二部分

与中心化储存相比较,分布式存储的优势




下面我从技术层面分享一下。

存储技术的发展路线一直是“不断强化冗余和故障域隔离来提高数据可靠性”。

桌面存储是一块盘,坏了就丢了。但硬盘的可靠性是有瓶颈的,再贵的盘也有千分之几的年故障率。

对企业级用户来说,这种将数据可靠性完全寄于硬盘质量的处境是无法接受的,所以就将数据分散存储在多块盘上。就是常说的RAID技术,可以允许一组盘坏一块(RAID5)甚至两块(RAID6),再加上良好的运维管理,任何盘坏了就及时换新盘重建,就能比较好地保障数据可靠性。

RAID5比较高效,但如果坏了一块盘,在重建过程中如果再坏一块盘就会丢数据。RAID6效率低一些,但在重建过程中还有一层保护,所以可靠性要高很多。大约桌面级存储是2个9的可靠性,RAID5是4个9,RAID6是7个9的可靠性。

但是到了大数据云存储时代,7个9也不够用了,举一个虽然不够准确但比较容易理解的例子来说,如果有1000万个文件,平均每年就要丢1个文件。

咱们做大数据的都知道,1000万个文件并不算天文数字,很多大数据应用都能达到。

所以云存储就进一步加强,将数据用三副本来存储,而且分散在多台存储服务器上,冗余度和故障域隔离都进一步加强了。

云存储的数据可靠性是按照11个9来设计的,比RAID6又高了4个数量级。

但随着大数据的普及,11个9仍然不够用,对单一用户来说1000亿个文件每年丢一个还算好,但对于公共基础设施来说就不是那么够用了,而且服务可用度也是一个大问题。

从实际结果来看,基本上每个月都能看到AWS/Google/Microsoft/阿里云/腾讯云等巨头中的一家出现各种故障的报道,轻则整个数据中心不可用,影响了用户,重则丢数据,让用户的数据资产直接化为乌有。

这些都是4000亿美元以上的巨头,都是全球最大公司之一,用了最贵的薪酬雇了最贵最好的人才,先后也干了10年甚至更长,但仍然没能彻底解决问题。

那按照存储产业的规律,又需要升级换代,继续提高冗余,强化故障域隔离了。这就需要跨地域的广域网存储才能进一步提高数据可靠性。

广域网存储是将成千上万甚至数千万的边缘节点上的存储空间聚合起来,构成一个统一的存储池。其显著优点是数据可靠性、服务可用性都远远超过云存储很多个数量级,而且还自带容灾性和抗DDoS这种奢侈特性。

我们一般保守宣传说YottaChain的数据可靠性比最好的云存储也要提高一万倍以上,实际上远远不止,一亿倍都不止,甚至一万亿倍都不止。

广域网存储因为涉及的边缘节点众多,要保证在无数个地域的边缘节点都能正常运营,用传统的集中式采购和集中式运维方式就不适用了。所以广域网存储又必须用全新的方式来建设和运维。






第三部分

区块链存储赛道目前的发展情况




经过了BT、IPFS等大规模的实验后,大家发现最好的方式是用区块链来激励。所以“广域网存储系统+区块链激励层”就成了世界上发展的一个主要方式了。

所谓区块链存储,就是区块链激励的广域网存储的简称,也就是刚才说的“广域网存储系统+区块链激励层”构成的存储系统。

区块链存储系统的存储节点并不是平台方所拥有的,实际上是其所有者带存储空间加盟的。

这就像滴滴上的车并不是滴滴所有,而是司机带车加盟一样。

滴滴管这么多车管得很累,但区块链存储就容易得到,因为我们有一个先天优势,就是存储是完全数字化的,全程都可以代码来控制。

存储是一个数字形式存在的实体经济,这是一个非常重要的特点,决定了存储是最适合用区块链改造的实体经济。

其它什么溯源之类的应用,只要是涉及链下代码不可掌控的环节,都不如存储能直接上链。

存储是一个基础设施,同时存储还具有庞大的独立市场,每年企业直接购买存储的费用是大几百亿美元,不到千亿美元。

这又比一般的公链具有独特的优势,我有一些做公链的朋友,公链做得非常好,技术团队也比我们更大,但是做出来之后没人用,最后只能勉力维持甚至倒掉。

但存储本身就是一个巨大的市场,做出来就可以直接打市场。也就是说,存储既是基础设施,又是独立应用,非常难得。

所以区块链存储就成了区块链最早跑出来的改造实体经济的商业应用。而且存储还有deduplication(数据去重)的特性,其特点是用的人越多,单位成本越低,非常适合用区块链来激励。

在这个领域,其实是美国先起跑的,IPFS在2015年就上线了,但是没有激励层,就没有足够多的节点,这事光靠热情和社区动员是不够的。

所以他们后来又搞了FileCoin,作为IPFS的激励层,在2017年一炮而红,半个小时就融了2亿美元,成为一个现象级的项目。在上个月,FileCoin开始提交测试,计划在今年三四月份正式上线。

YottaChain虽然起步晚,2018年8月才开始做,但我们底子好,我们团队做存储和密码学都有很多年了,非常专业。存储是一个专业性非常强的行业,没搞过的人用再多钱也搞不好的。

IPFS虽然是明星项目,但它的团队以前没做过存储,在专业性上就比我们逊色了很多。在密码学方面差距更大,IPFS/FileCoin干脆就没有做数据安全的设计。但从产品本身需求来说,广域网存储是必须要求数据安全机制的。

传统存储,无论是桌面存储、企业级存储还是云存储,数据安全都只是一个亮点而已,没有也关系不大,因为物理设备都在owner的掌控下,所以往往存储是存储,数据安全是数据安全,两张皮,后者有更好,没有也无所谓。

但在广域网存储,数据都是存在边缘节点上,每个边缘节点不仅没有安保人员,没有防火墙,甚至所有权都是归属不知道什么人。

可能是你的竞争对手,可能是你的同学邻居,也可能是你的情敌。所以数据安全机制就成为了一个必要项了。






第四部分

区块链储存落地情况及未来展望




我们团队做数据安全超过20年

我们的方法就是:我们设计时就基于不信任任何人的原则来设计“we don't trust anybody, including us”。也就是说,就算从我开始全公司的人都被美国人收买了,国家安全部门用我们的系统保管涉密文件,也依然是安全的。

很多人提数据安全就以为等同于加密算法,其实不是这样的。

如果说一套数据安全机制是一栋楼的话,那加密算法就是钢筋水泥,只是我们的原材料。

我的角色就是建筑设计师,设计一套任何人攻击都偷不走数据的安全体系,相当于设计一个能抗10级地震的大楼。

钢筋水泥固然重要,但仅仅有钢筋水泥是绝对不够的。换句话说,我干的活和中本聪是一样的,我们都没发明密码算法,但我们用密码技术构建了一套安全体系,这套体系是公开透明的,但却无人能攻破。

自从区块链大热后,我的社会地位大幅度上升,过去简直说不清楚我们这些没有发明密码算法的科学家有什么用,现在只要说跟中本聪一样,大家就肃然起敬了。

再具体说,我们体系中数据是全程加密的,而且是无缝加密,不会出现任何的安全缝隙,例如先做通讯层的加密解密,再做存储层的加密解密。

数据安全的核心是密钥管理,我过去做的系统有上万亿把密钥,要非常好的管理起来,既不能给正常用户带来不便,还要防止坏人攻击偷走。







请到「今天看啥」查看全文