专栏名称: 科研者之家
这里是科研者之家www.home-for-researchers.com/的官方公众号,所有工具入口均在官网首页上。“科研不停,神器不止”。
目录
相关文章推荐
51好读  ›  专栏  ›  科研者之家

“生信零代码”时代已来:Cell的分析照样零基础做

科研者之家  · 公众号  ·  · 2024-01-29 22:27

正文

请到「今天看啥」查看全文


作为科研者,如果你到现在还不知道 生物信息学 ,那真的太out了,生信有多火? 拿最有名的数据库TCGA( Cancer Genome Atlas )来说, 目前已经收录了来自1万多例病人的33种癌症的数据,2.5PB的数据量。


在pubmed中随便搜一个TCGA,就可以发现近年来相关文献发表量在成指数级增长。



这其中,一部分是利用TCGA数据库发表的纯生信文章,比如 2018年4月 发表在Cell上的一篇 Comprehensive Characterization of Cancer Driver Genes and Mutations ”。



也有很多利用TCGA数据库的图片给文章增色的, 比如 2019年3月4,耶鲁大学 陈列平 教授团队在 Nature Medicine 上发表题为 Siglec-15 as an immune suppressor and potential target for normalization cancer immunotherapy 的文章,里面就利用TCGA数据库分析了Siglec-15 和T cell signature genes (CD3E, IFNG, GZMA and GZMB) 在膀胱癌中的关系。



而这些都不需要额外的湿实验,大大提高了临床医生的科研效率。这也是生信之所以火的原因了。


但你可能要问,如果不会R语言,不会代码,怎么利用利用生信来提高科研效率呢?


或许参加过好几千一次的培训班,但结果就是,课堂上什么都会,一回去自己弄马上就被各种 报错 打败,自学视频,同样是困难重重。



科研界一直需要一个功能强大,不需要代码,可视化分析工具。


科研者之家(Home for Researchers) 上有一个生信零代码版块:


已经有数十种分析模块,整合了 TCGA,GEO,Target,ICGC,CCL E五大公共数据库的样本数据, 可以直接拿来用


平台是由几个临床医生联合生信大拿一起搭建,界面极其简介。


比如在TCGA模块, 界面极其简介,左侧栏是TCGA上所有33种肿瘤类型,之后第二期会纳入非肿瘤的疾病。 顶部是各种分析模块。 首页特别注明了,所有数据均由R v4.0.3分析完成, 意思就是说在平台上分析的结果和拿R语言敲代码分析的结果是完全一样的,这就太爽了。



别看界面简单,该平台功能极其强大,比如想分析下 “某个 基因在肺腺癌里EGFR突变和野生型病人中表达水平和预后差异”就轻而易举。


平台有极其强大的样本筛选功能,可以对样本进行除了 临床信息,治疗信息 的进一步筛选外,比如可以根据某一个基因是否突变筛选,某一个基因的表达量水平进行筛选,比如近年来火热的 肺腺癌EGFR野生型伴PDL-1低表达 相关研究,就完全没问题了。 这也是目前已知所有第三方网站无法实现的。


样本筛选表


样本筛选好后,就可以选择需要的功能模块进一步分析啦。


单样本分析, 顾名思义就是针对某一个样本的分析,里面的工具目前包括了 临床信息比较,批量生存分析,基因与生存,基因与TMB/MSI,桑基图,两基因相关性。



而多样本分析, 就是针对某几个样本之间差异的比较,目前包括以下工具:

多组生存,基因表达比较,miRNA比较,突变比较, 免疫评分,免疫检查点 ,甚至 铁死亡,m6A



在复杂分析里, 集成了以下耳熟能详的分析模块,比如 亚组分型, 基因突变景观, 差异基因分析, 预后模型(列线图),预后模型(Signature) 泛癌分析。



然后,在 思维导图和视频教程 里,180师兄和911师兄讲解了如何使用“十字研究法”,交叉运用单样本和多样本工具,让课题设计思如泉涌。



这些分析如果让公司去做,估计要 几百上千甚至上万 了,而这个平台鼠标点击几下,就可以生成所有的 高清矢量图 ,更重要的是还有对应的 原始数据下载 ,这个相当重要。


不仅如此,平台还针对每一个分析结果,给出了对应 图例,方法学,结果的中英文对照 ,和参考文献,这个对我们写文章也很重要。



从课题设计,工具使用,再到零代码,一键分析,原始数据下载,再到论文写作, 不得不说,这个由一群医生创建的生信平台,实在是太懂广大科研gou了。


有木有一种相见恨晚的赶脚呢?







请到「今天看啥」查看全文