专栏名称: GIJN
全球深度报道网(GIJN)致力于整合并分享深度报道资源,包括报道手册和书籍、国内外公开数据库、数据新闻工具包和深度报道的前沿探索。
目录
相关文章推荐
51好读  ›  专栏  ›  GIJN

互联网有96%的内容都位于“深网”,我们要如何才能检索到?

GIJN  · 公众号  ·  · 2019-09-28 00:05

正文

大多数的记者每天都会使用谷歌进行检索,但是搜索引擎能够覆盖的范围只有 4%,而无法被搜索引擎搜到的部分基本都可以划归为「深网」(Deep Web)的范畴。如何检索「深网」的内容?德国记者与新闻培训专家 Albrecht Ude 在第11届全球深度报道大会上分享自己的经验。


来自全世界的调查记者齐聚在汉堡第十一届全球深度报道大会。 图片: Nick Jaussi / nickjaussi.com


大多数的记者每天都会使用谷歌进行检索,但是搜索引擎能够覆盖的范围只有 4%,而无法被搜索引擎搜到的部分基本都可以划归为「深网」(Deep Web)的范畴。 如何检索「深网」的内容? 德国记者与新闻培训专家 Albrecht Ude 在第11届全球深度报道大会上分享自己的经验。


「如果你要找的内容藏匿在深网里,那么搜索引擎肯定是毫无用处的。 」Ude 说。


那么记者该如何获取深网中的信息呢?


Ude 认为我们应该使用抽象思维——不要去想具体内容,而需要发挥想象力,猜想你想要的内容可能被放在互联网的哪个角落。 基于这种猜想,再去寻找相关的数据库。


但搜索引擎通常只能搜索到数据库的文件名,而覆盖不到数据库的具体内容。 所以在检索具体数据的这步上,你只能亲力亲为。 例如,如果你需要某位建筑师的住址与联络信息,你可以查看有没有地区性的建筑师协会数据库,然后再浏览查阅数据库中存储的内容。


Ude 分享了四个小贴士,帮助你找到搜索引擎覆盖不到的数据库:

是谁在运营数据库?


在你寻找信息的时候,问问自己: 谁最有可能投入时间与金钱去建立、维持一个包含这些信息的数据库呢? Ude 认为,这个问题是搜索引擎解决不了的,「只能由你的头脑解决」。


善用搜索引擎语法


根据搜索引擎的算法,你可以在搜索引擎中输入「database OR directory OR catalogue OR registry」,这样你就可以得到相应的数据库/名录/目录/登记簿。







请到「今天看啥」查看全文