专栏名称: 生信媛
生信媛,从1人分享,到8人同行。坚持分享生信入门方法与课程,持续记录生信相关的分析pipeline, python和R在生物信息学中的利用。内容涵盖服务器使用、基因组转录组分析以及群体遗传。
目录
相关文章推荐
生物学霸  ·  刘万里团队招聘博士后、研究助理和技术员 ·  5 天前  
生物学霸  ·  32 亿的新校区,捐了 ·  5 天前  
BioArt  ·  Nat Cell Biol | ... ·  5 天前  
BioArt  ·  Nature丨Sarah ... ·  1 周前  
51好读  ›  专栏  ›  生信媛

CS10: 八卦终结版

生信媛  · 公众号  · 生物  · 2017-12-14 08:58

正文

ChIPseeker系列传送门


ChIPseeker这个系列,从《CS0: ChIPseq从入门到放弃》到现在CS10,总共11篇,第一篇以八卦开始,我想很有必要以八卦来结束,写完这个系列,ChIPseeker正好被引用了100次。

ChIPseeker的开发源自于专家叫我为他人分析ChIPseq数据,我接触ChIPseq的时间也就三个月的时间,期间为了帮别人做嫁衣,造了这个轮子,然而专家在此期间,不断拖后腿,比如《CS9: GEO数据挖掘》中写的数据挖掘,专家跟我说,要把GEO所有BED文件打包供用户下载,这显然是不现实的,首先我们自己没有那么大的存储空间,专家还要求我打包在软件包里,你能想像你要用一个软件,那个软件却有几个T辣么大吗?不管我怎么说,专家都只会回一句:“相信我,我做为用户,我就想我给个数据,你把我的数据和数据库里所有数据比一遍”。你再讲的时候,他就只会回“相信我”,并且语气表现出不耐烦,你还能怎么样呢?这里的所有数据比一遍,也就是说你还得打包所有的chain files,然后跨物种跨基因组版本全都来一遍哦。臣妾真的做不到啊,比如一个人做果蝇,只想下果蝇的数据,他却只能把人鼠可能都不止几个T的数据下载下来,他只想比较一下果蝇的数据,快速看一下结果,但是却要等好久,让程序把人鼠斑马鱼线虫等全部都比一遍!这不科学!然而他是专家,我得相信他!

假期如何假装我们还在工作?》一文里提到的嘉道理农场,我当时晚上在宿舍里就还在爬GEO数据,真的是「垂死梦中惊坐起,那人还在下文件」。

这是不可能的任务,然后专家还天天说“I want to see the paper”,软件搞不下去,文章还得写出来给他。当然我那时候并没有写文章,我只能说我还在搞,数据太大,还没下完。开组会问我有什么问题,我要是没问题,paper就得吐出来了,我已然得相信他,已经不能说数据太大了。我就拿chain file来说,我说太多的情况了,多对多的比较,问题比较复杂,我还在写代码(其实也就是一堆判断语句而已)。于是专家煞有介事地在白板上画起来,“来来来,让我教你写代码”,比如一个人拿了一个数据,你和数据库比一下,一对多,完。那来的多对多,简单得很。我解释说,一个人拿hg19的数据吧,一对多,另外一个拿个mm9的数据吧,一对多,我得应对用户不同物种、不同基因组版本的数据,这就是多对多。

然后专家又继续,就拿hg19来说吧,你所有物种、基因组版本全部用chain file转换成hg19,一比完事,一对多。

然后我再继续,再拿个mm9,以及其它,多对多。

专家又继续,就拿hg19来说,先不说mm9。

嗯如此反复,起码半个小时。所以这一天,从早上开始,我的心情已经不好,专家的心情也不好。大家都不耐烦。下午,专家又叫我用proteinPilot分析蛋白质组的数据,我说我们没有机器可以跑这个Windows软件,他要求我下载,于是我在我的MacBook下载了这个软件,让我点安装,于是我点安装,然而报错啊,不能安装,于是作罢。不要跟我说可以装palallel desktop什么的,实验室没给我配电脑,我自己2011年的笔记本是跑不动的。后面就是《我在MSnbase里做了什么?》的场景就出现了,同一天搞太多次,我的意志力已经消耗光了,一看到他就烦,他对我吼“我才是这里的专家”,然后起码数落了我一小时,我一直没回应,他则越说越来劲,说到我就像一陀屎一样,我最后讲了一句“我不干了”。当天晚上,他给我写了信,要求手写检讨书。

专家还有学生曾经被罚站,他告诉我他想从窗口跳下去。这个学生也是挺惨的,专家曾经给他安排实验,精确到一天每一个小时要做什么,都给安排好了。

离开了专家的实验室,没有了专家的束缚,GEO数据挖掘功能我一下子就写出来了,按照我自己的意愿,我只提供数据检索和下载功能,至于要下载什么,要和那些数据做比较,全凭用户自己决定。

说到电脑,你们能想像一个做生物信息学的人,实验室不给配电脑吗?当时实验室只有一台机器,是公用的服务器,我给组装的,而且由于预算太少,连显示器都省了。所有人都是用着自己的笔记本,我自己买了个显示器带回实验室用,专家看到了,问我我的显示器是服务器配的吗?我说不是,是我自己买的,专家哦了一声,没下文。后来我拿去新实验室,老板看到问我显示器怎么跟别人的不一样,我说我自己的,老板就给报销了,这才叫老板!

曾经有人跟我说,受过我的指导,成功躲开了专家,我猜她是那个南开年级第一名的学生,拿了HKPF然后不来。然而这个人并没有联系过我,有能力的人,看到坑就跑了,而没能力的人老缠着你,想让你告诉他这不是真的,想让你跟他讲现实也没那么惨。

专家的学生要劝退新生,又怕被发现。用马甲联系了还没来入学的新生,导向到我这里来。我扔还给他们,让他去脸书找专家的学生问,这些可怜又可恨的人最终都会来。

专家也成了隔壁实验室的娱乐对象,比如读文献奖励小星星之类的,比如比惨之类的,也是一大贡献,保障了嘉道理其他实验室学生的身心健康。

专家现在招学生,都不敢跟他的学生讲了,因为之前讲了,他的学生就会去劝退,而这些人劝退,经常就会导向到我这里来,让他们看我写的东西,然后就不断有人想跟我求证,「这不是真的」,「其实还可以,只不过比较push而已」,「是不是因为我跟专家有过节,故意黑他」,我反正是晒了很多邮件、截屏什么的,我不会跟你们这些给自己灌迷魂汤的可怜人费口舌的,爱信不信,本故事纯属虚构,如有雷同,纯属意外。

本来都预约推送了,结果又在非死不可看到专家的学生的状态,又多一张图。

点开「阅读原文」吧,告诉你们谁是专家!