专栏名称: 实验万事屋
文献总是乏味,科研一向无聊,“实验万事屋”旨在拯救医界同仁于寂寞无聊,每天坚持抖落科研内幕,分享实验心得,搜集科研资讯,激发您的科研兴趣,传授实用的科研方法和思路。做不做科研,从医之路大不同,在这条布满荆棘的科研道路上,我们与您一路同行。
目录
相关文章推荐
国际新闻界  ·  《国际新闻界》2025年第1期目录 ·  昨天  
募格学术  ·  DeepSeek爆火!我们又该如何利用AI提 ... ·  昨天  
NaturePortfolio  ·  对话编辑︱Springer ... ·  3 天前  
PaperWeekly  ·  北京内推 | ... ·  4 天前  
51好读  ›  专栏  ›  实验万事屋

BiuBiuBiu地搜间接关键词

实验万事屋  · 公众号  · 科研  · 2017-05-11 08:53

正文

你们都搜过文献,要知道一个基因跟另外一些基因的关系,或者和疾病用药的关系,这都是能搜到的。一般来说,就是点对点的搜索,就像这样:

但是要是间接关系呢?比如,我要找小明的二舅,我首先第一次搜索只能搜到小明,然后再在小明的基础上再来搜他二舅。那就相当于是要从关键信息来搜索,与之有间接关系的关键词了。


那于是就有了这样一个工具,没错,我汉化了一下,比如我搜索TP53的直接关系:

这里有词频,逐点交互信息,对称条件概率,这个都不重要,都是套路。这个网站用了传说中的机器学习,来进行具体分析,从MedLine的摘要和标题中提取相应的信息,来进行词与词的关系。

所得到的结果就是这样的,包括与之相关的基因蛋白,当然,你要知道TP53就是P53,所以相关性更高,方块的面积就更大。这几个不同颜色的板块,就分别代表:基因、疾病、症状、药物、酶以及复合物。每个都能够单独进行分析,当然方块越大相关性越大。(实际上每个方块都有一个相关文献文档的链接,但是不知道什么原因打不开 ,其实也没什么,能知道有相关性,当然自己去搜搜也行吧)


那接着这个就是关键了,刚才我们也说了,点对点的直接搜索相关关键词是比较常见的,那要是要找到简介相关性,就像这样:

其实这个工具也有搜索简介相关功能,用的是高大上的文本机器学习什么的算法(说实话我也不懂 ),比如P53的间接相关性就是这样的:

比如,我们搜与P53相关的基因,然后现实与这些相关基因相关的基因,是不是很拗口?当然,这里的关键概念和目标概念内容,都是可以改的,就像这样:

那你要说了,这我也看不懂啊!等你鼠标移到方格上你就懂了,就会出现这样biubiubiu的特技效果。

那有啥用呢?当然,你搜一个间接相关的基因,可能就可以为你的分子扯上信号通路带来便捷,也能用到下面这种用途,还可以看病!比如,我搜了一个疾病,我实在是懒,就搜了Cancer,然后一级关键词搜的是症状,二级关键词搜的是用药。就变成了这样:

好吧,当然也并没有什么卵用……

…华丽丽的分割线…

李莫愁博士: 文本的挖掘,我们一般只停留在一级的层面上,这个工具,却可以让我们深入地挖掘到更下一层的关键词中。有兴趣的话,大家自己去试试吧,回复“ ABCD+ ”就能获得网页了,今天就先策到这里吧。



延伸阅读:

分分钟给你一个新课题,就这268个样本







请到「今天看啥」查看全文