你们都搜过文献,要知道一个基因跟另外一些基因的关系,或者和疾病用药的关系,这都是能搜到的。一般来说,就是点对点的搜索,就像这样:
但是要是间接关系呢?比如,我要找小明的二舅,我首先第一次搜索只能搜到小明,然后再在小明的基础上再来搜他二舅。那就相当于是要从关键信息来搜索,与之有间接关系的关键词了。
那于是就有了这样一个工具,没错,我汉化了一下,比如我搜索TP53的直接关系:
这里有词频,逐点交互信息,对称条件概率,这个都不重要,都是套路。这个网站用了传说中的机器学习,来进行具体分析,从MedLine的摘要和标题中提取相应的信息,来进行词与词的关系。
所得到的结果就是这样的,包括与之相关的基因蛋白,当然,你要知道TP53就是P53,所以相关性更高,方块的面积就更大。这几个不同颜色的板块,就分别代表:基因、疾病、症状、药物、酶以及复合物。每个都能够单独进行分析,当然方块越大相关性越大。(实际上每个方块都有一个相关文献文档的链接,但是不知道什么原因打不开
,其实也没什么,能知道有相关性,当然自己去搜搜也行吧)
那接着这个就是关键了,刚才我们也说了,点对点的直接搜索相关关键词是比较常见的,那要是要找到简介相关性,就像这样:
其实这个工具也有搜索简介相关功能,用的是高大上的文本机器学习什么的算法(说实话我也不懂
),比如P53的间接相关性就是这样的:
比如,我们搜与P53相关的基因,然后现实与这些相关基因相关的基因,是不是很拗口?当然,这里的关键概念和目标概念内容,都是可以改的,就像这样:
那你要说了,这我也看不懂啊!等你鼠标移到方格上你就懂了,就会出现这样biubiubiu的特技效果。
那有啥用呢?当然,你搜一个间接相关的基因,可能就可以为你的分子扯上信号通路带来便捷,也能用到下面这种用途,还可以看病!比如,我搜了一个疾病,我实在是懒,就搜了Cancer,然后一级关键词搜的是症状,二级关键词搜的是用药。就变成了这样:
好吧,当然也并没有什么卵用……
李莫愁博士:
文本的挖掘,我们一般只停留在一级的层面上,这个工具,却可以让我们深入地挖掘到更下一层的关键词中。有兴趣的话,大家自己去试试吧,回复“
ABCD+
”就能获得网页了,今天就先策到这里吧。