专栏名称: 待字闺中
深度分析大数据、深度学习、人工智能等技术,切中实际应用场景,为大家授业解惑。间或,也会介绍国内外相关领域有趣的面试题。
目录
相关文章推荐
福州新闻网  ·  雷军,中国新首富! ·  昨天  
福州新闻网  ·  雷军,中国新首富! ·  昨天  
涵江时讯  ·  太猛了!大涨600% ·  昨天  
涵江时讯  ·  太猛了!大涨600% ·  昨天  
Alisha全球出海日记  ·  《从0到100万美金:解锁Kickstart ... ·  昨天  
Alisha全球出海日记  ·  《从0到100万美金:解锁Kickstart ... ·  昨天  
内江头条  ·  啊?中国男性平均寿命仅69.9岁? ·  2 天前  
内江头条  ·  啊?中国男性平均寿命仅69.9岁? ·  2 天前  
龙岩发布  ·  2024胡润中国500强出炉!这两家龙岩人创 ... ·  2 天前  
龙岩发布  ·  2024胡润中国500强出炉!这两家龙岩人创 ... ·  2 天前  
51好读  ›  专栏  ›  待字闺中

一个巨大商机:如何解决互联网信息的可靠性?

待字闺中  · 公众号  · 程序员 科技自媒体  · 2016-10-08 06:24

正文

互联网上的信息鱼龙混杂,如果谁有一个好的算法或是办法来解决信息的可靠性问题,将是一个巨大的商机,比搜索引擎还大,比新闻媒体还大,的商机。Google,百度等搜索引擎解决了覆盖率,实时性,多样性和相关性的问题,但是,他们都没有解决信息的可靠性,可信性的问题。对于排名在前的搜索结果,如果你是一个新手,将无法判别信息的真伪,信息的有效性。对于一个新闻,无法判别来源,无法查证,只能被动的相信,很多情况下是误导,作者或是出版商为了吸引眼球的误导。


看看昨天一则关于中国男足输给了叙利亚男足的新闻。如果不做深入的调查,不做深入的思考,很多的读者会以为是真的。更可怕的是,自己信了,也许还没信,但觉得有意思,还会拼命的在朋友圈,微博,自媒体,等,转发,扩散。本来一则没有考证的假新闻,最后,由于无脑的吃瓜群众太多,竟成了人人皆知,人人茶余饭后的谈资,人人信以为真。




再看最近朋友圈疯传的喝苏打水可以饿死癌细胞的新闻,这个也还没有科学的证据的。但是,被大家这么一疯传,一个没有科学证据的信息,就被大家认可成了治疗秘方,不知道,以后很多患者这么做的话,不知道要耽误了多少病人的治疗,不知道多少无良的商家又会借机炒作苏打水。




还有像下面这种信息,居然是从大家信赖的搜狐财经新闻出来的。一千人民币在中国就可以养老?还有点基本常识吗?搜狐的编辑也不做一点基本的验证吗?感觉,在这个时代,一切为了眼球,一切为了利益,估计什么都没有顾忌。




当初的一个“水变油”的把戏,居然把国人玩了十年之久,是的,十年!很多的吃瓜群众还真的相信了,还把这个认为是知识,是常识了。还有,当初,包括现在,某些保健品,骗了多少人,特别是老人。




在百度上搜索“快速致富项目”,有很多,没有多少思考,追求暴富的人,还真的会花钱去尝试这些项目,很多互联网上被骗的同学,往往也是这种天上掉馅饼的心态,结果反而被坑了。如果真有快速致富的办法,发明者不是应该偷偷的去用去赚钱吗?越少人知道越好吗?




这些例子,想说明,现在互联网上的信息,没有一个很好的机制来控制来源,控制真伪,控制质量,谁想说什么,有很多的渠道可以自由发表,然后读者会取其所好,选择性扩散,没有几个人能负责任的考究和验证,包括很多的大V,公知,名人,可能很多时候都是信手转了,成了不良信息的源头。


那么,在这种情况下,除了国家政府执法机关建立严格的法律程序和制裁以外,对于商业公司,如果能发明好的算法和办法,类似于现在的征信体系,必然存在着巨大的商机,能完全颠覆现在搜索引擎,变革现在的媒体传播,真正让老人,让小孩,让没有经验,让不愿思考,等等,的广大群众,和平民百姓,真正享用到真正的科学知识,了解事实的真相。


看到一些思路和方法在朝着这个方向努力。


比如,Google的PageRank,但这个还是根据流行度,不是根据信息的真伪来排序和计算重要性。之后,有关于SpamRank的研究,也有关于TrustRank的研究,但还没有看到革命性的效果。


比如,让某个领域的专家写的,或是引用过的,来对信息进行排序和计算可信度。这是一个不错的方法,现在,微博,微信,公众号,的关注的设计,实际上是给了用户一个找到真实信息的方法。这个,必须要求这些专家,名人,公知,等,必须是公正的,值得信赖的。


比如,之前还有对于出自于.gov和.edu的信息给予更高的可信度。初期,由于.edu和.gov的域名注册和内容生成是严格控制的,这个方法还是比较有效的。但后来,由于这些网站也提供UGC,也有商业化的需求,信息的可信度就降低了,以至于和商业网站没有什么区别。


现在,互联网的信息有局域网化的趋势,比如,Facebook,Twitter,微博,Pinterest,Snapchat,微信,App Store,等等,都拥有海量的用户和海量的信息,这些信息有他们各自独立控制,各自为政,阻止和别的网站共享,好像是他们的私有财产,可以任意屏蔽,宰割,这种趋势,是否能促进他们拥有的信息,在强大的管理的威慑下,变得可信可靠?


还有,BlockChain技术,能够无法篡改的记录信息的源头,和信息的作者,这个,是不是能在信息的可靠性这个领域取得突破,我们拭目以待。


再有,随着大数据处理技术,和深度学习技术的突飞猛进,以后,有可能通过算法和技术的手段,将多种信息交叉验证,自动的去伪存真。


总之,期待着在信息的可靠性上,取得突破,这是一个商业机会,也会有巨大的社会影响力。


----- The End -----


大家可能还感兴趣:








请到「今天看啥」查看全文