专栏名称: 待字闺中
深度分析大数据、深度学习、人工智能等技术,切中实际应用场景,为大家授业解惑。间或,也会介绍国内外相关领域有趣的面试题。
目录
相关文章推荐
程序猿  ·  “我真的受够了Ubuntu!” ·  昨天  
李楠或kkk  ·  AGI ... ·  昨天  
杨浦科技创业中心  ·  喜报丨杨浦科技创业中心进入上海市海聚英才创新 ... ·  昨天  
杨浦科技创业中心  ·  喜报丨杨浦科技创业中心进入上海市海聚英才创新 ... ·  昨天  
51好读  ›  专栏  ›  待字闺中

内容孤岛,应用孤岛,数据孤岛,以及自私的基因

待字闺中  · 公众号  · 程序员 科技自媒体  · 2016-10-22 13:14

正文

互联网的初期,网站之间信息自由流通,因为它们的流量大部分是通过目录网站,像Yahoo,hao123,或是搜索引擎,像Altavisa,Google,而来的。它们普遍对爬虫都是开放的,没有怕被人偷走的和自我保护。


接着,出来了电商网站,为了保护商品信息,防止竞品比较价格,它们开始注重保护自己的内容,但又不想失去搜索流量,于是开始有选择性的屏蔽某些抓取。然后,出现了社交网站,比如Facebook,出现了实时内容发布网站,比如Twitter,它们由于自己有海量用户,自成一个系统,不再依靠搜索等外部流量。于是,它们基本完全阻止了其它的爬虫来抓取它们的内容,于是,各种内容孤岛开始形成。


后来,Apple一改大家之前的网站网页模式,推出了App Store,通过一个一个的App,让用户下载才能使用。有的App使用了HTTP/HTTPS协议,有的使用了自有的基于TCP/IP的数据通信交换协议,并且很多的App都是需要用户注册,享有自己的独有数据,于是,形成了一个一个的App孤岛,各自为政,互不分享。尤其是某些高利润行业,像旅游,电商,保险,医疗,等等,都被App统治了,用户不再依靠开放的搜索引擎。还有就是UGC,PGC,视频,图片服务,很多都是封闭性的系统。这种应用孤岛已成大气候。


现在,大众普遍认可数据就像石油,电,水一样,是公共资源,是人们生活中必不可少的一部分,越来越珍贵,越来越有价值。于是,大家都把数据当作珍宝,藏着掖着,不再愿意分享,造成大者恒大。虽然有一些边缘数据在分享,但核心数据全是自己留着。这样,形成了很多的数据孤岛。


正好最近在读《自私的基因》,上面的各种孤岛现象,好像从书中都可以找到答案。


“成功的基因的一个最突出的特征,就是它的无情的自私性。这种基因的自私性常常会导致个体的自私性。然而,我们也会看到有些基因为了更有效的达到其自私的目的,在某些特殊的情况下,也会滋生出一种有限的利他主义。。。一旦当我们以审视的眼光看待生物这些明显的利他行为时,我们就会发现在这些行为的背后隐藏着出于自私的伪装。”







请到「今天看啥」查看全文