正文
前段时间接二连三带了不少实习生和轮转生,发现有些内容总需要重复的说,一件事情连续说三遍就效率太低了,还是把一些东西写下来,以后直接丢过去一个链接和微笑就好。
这一篇内容列举几个入门生物信息的角度 ,可以让想要入门的伙伴知道门在什么地方。另一篇文章会相对全面的列举生物信息学常用软件和方法。需要说明的是,文章本身不会涉及太多细节。你既可以把它当成一个入门学习清单,也可以用来对照查找自己的知识盲区。
无论是入门生物信息还是学习其他技能,其实关键就在于掌握自主学习的工具和方法。
学会学习再去学习,学什么都不是问题。
生存必备基本技能
学会Google
学会如何正确搜索,接下来的内容就全都不愁了。但如何使用Google也许并非像大部分人想的那么简单。
学会Google的前提是能用上Google,这里点到为止,开源软件可以用XXnet https://github.com/XX-net/XX-Net,如果有条件也可以使用微屁恩。
如何搜索日常遇到的bug
入门生物信息初期最大的困惑就是每跑一个软件没运行一个命令都会遇见各种各样的问题,好像我们天生就是来和bug相遇的。但是没关系,你遇到的绝大多数问题早就有人遇到而且已经解决了。
利用Google搜索bug的时候,基本的搜索内容只要包括你的报错简单信息加上所用软件再加上版本,就能找到解决办法了。如果要在相关社区提问,附上你的源代码和几行有问题的原始文件是基本的礼貌和要求。
习惯用英文来搜索
如果一个问题用中文搜不出来你想要的答案,还是用英文来搜索吧。
简单常用技巧
用双引号“搜索内容”进行精确搜索
很多时候,我们需要使用精确搜索,比如在进行一些常用软件安装或者使用的过程中会出现各种各样的报错,这时你把软件的报错信息用双引号括封装,后面再加上软件的名字和版本,Google就会进行精确的匹配搜索。很可能第一条搜索结果就是你要的。
用-搜索内容进行排除搜索
在一些情况下,一个主题词往往会和若干个内容关系密切。这时候我们希望明确排除某个我们不想要的内容。
具体文档类型搜索
这个技巧当你在想要查找具体类型文档的时候非常有用。如你想要pdf版本的只需要在搜索内容的最后加上 filetype:pdf
指定网站搜索
对于码农而言 stackoverflow.com
是一个常用的网站,对于生物信息工作者来说biostar是一个非常好的论坛。如果我们想在某个特定的网站进行搜索的话,你可以在搜索内容之后加上site:*.com*
,你得到的答案就全部来自这个网站了。
学会记录
可能会用到的工具
作为一个很爱丢笔记本的人,实在是不敢把什么都写在本子上了,其实主要原因是字太丑。
印象笔记是我用了多年的云笔记,配合vs code 的印象笔记插件可以方便的使用Markdown来书写并进行保存。当然,其他云笔记只要你用的惯都可以。
我的印象笔记已经有两千多条各种各样的笔记了,印象笔记里的东西越来越多,如果需要纯粹理思路的时候会显得臃肿。
思维整理,大纲类笔记我一直使用幕布(类似于 WorkFlowy 的国产应用),比如这篇文章的大纲就是在幕布中完成的,你可以复制链接https://mubu.com/doc/5MGyymO3J 或者点击阅读原文查看。
这类笔记工具非常轻量,各种端秒同步;而且你只需要也只能写一个个的list,每个list逻辑很清晰,先是什么再是什么一目了然。还能一键生成思维导图分享给别人。如果你总是需要做presentation,或者总是做事情没有头绪,可以尝试一下这个工具。
markdown
学会了markdown 你就再也不想用office word,再学一些LaTeX 基本语法就更好了。使用markdown进行写作目前来看也算是一个生物信息入门者必备技能了,相关介绍可以查看博客 http://kaopubear.top/2017-02-04/2017-02-04-trymarkdown/
基本语法学习地址 http://wowubuntu.com/markdown/
关于markdown编辑器的选择有很多,这里推荐且及推荐 typora https://typora.io/ ,当然,使用各种编程常用编辑器再配合插件也是可以的。
文献管理
读研究生少不了看文献,关键是怎么快速找到自己曾经度过的内容。
推荐使用Mendeley https://www.mendeley.com,基础版本不收费且颜值高同步快上手简单。也可以直接使用 Google学术,打造自己的线上图书馆。其实就是类似与收藏网页一样把看过的文献收藏在谷歌学术里。
另外F1000 http://f1000.com/prime 是个不错的网站,文献下载如果实在有困难可以考虑sci-hub http://sci-hub.cc/
包含有生物信息相关文章的常用期刊,CNS和PNAS就不多说了。其它还有:
学会收集信息
这里想强调的一点就是学会使用RSS,目前生物信息相关的博客有不少,很多优秀的博客其实都支持RSS订阅,另外常见的网站如biostar和学术期刊也都支持RSS定于,让他们更新的内容每天自动来你的RSS阅读器中报道,方便快捷。我目前在用的RSS阅读器是inoreader。
下面是真正和生物信息紧密相关的内容,注意,这些只是门,不会具体写每个门怎么进去。
服务器使用
软件如果是windows系统,首先要让自己的电脑连上服务器。
操作系统
linux
ubuntu http://cn.ubuntu.com/download/
双系统管理工具 vmware workstation
下载地址 https://www.vmware.com/products/workstation.html
参考学习资料推荐
生物信息入门基本知识
数据产生
数据存储类型
数据库资源
拟南芥
水稻
rapdb http://rapdb.dna.affrc.go.jp/
msu http://rice.plantbiology.msu.edu/
ricexpro http://ricexpro.dna.affrc.go.jp/
其他物种
NCBI
ENSEMBL
蛋白
EBI http://www.ebi.ac.uk/services/proteins
pfam http://pfam.xfam.org/
uniprot http://www.uniprot.org/
GPOFILER http://biit.cs.ut.ee/gprofiler/index.cgi
GO http://www.geneontology.org/
生物信息工具查询网站
https://bioinformatics.ca/links_directory/
https://omictools.com/
https://www.atum.bio/resources/bioinformatics-tools
https://wiki2.org/en/List_of_RNA-Seq_bioinformatics_tools
生物信息统计入门基础
基本概念
统计方法
实现方法
结果可视化
相关软件算法实现
编程基础
生物学基础知识
其他推荐:师妹 你要的都在这里了
点击阅读原文,即可到达作者的博客。
还有更多文章,请移步公众号阅读
如果你生信基本技能已经入门,需要提高自己,请关注上面的生信技能树,看我们是如何完善生信技能,成为一个生信全栈工程师。
如果你是初学者,请关注下面的生信菜鸟团,了解生信基础名词,概念,扎实的打好基础,争取早日入门。