专栏名称: 生信百科
依托高校科研平台,面向生物信息科研工作者。生物信息学习资料;常见数据分析技巧、流程;公共数据库分享;科研思路分享;
51好读  ›  专栏  ›  生信百科

高效而简单的序列 motif 富集方法

生信百科  · 公众号  · 医学  · 2017-10-23 09:17

正文

序列 motif 就是一段有功能的、特定模式的序列,它之所以可以具有生物学功能,是因为它可以和调控蛋白结合,如转录因子、核糖体等。

有的时候我们在做基因共表达分析的时候,往往会对同一模块(共表达模块)的基因进行启动子富集,验证他们是否收到共同的启动子调控,这样就用到了启动子富集分析。

软件 meme(http://meme-suite.org/tools/meme) 可以从序列中找到新的、没有 gap 的 motifs,其输入文件可以是 DNA、RNA 或蛋白质序列。该软件的在线版限制序列大小为 60,000 bp ,在使用上有一定的局限性,这里介绍其本地版的用法。

安装

meme 的安装方法如下:

  • 下载 http://meme-suite.org/doc/download.html/

  • 安装命令


tar zxf meme_4.12.0.tar.gz

cd meme_4.12.0

# --prefix 指定 meme 的安装路径,路径可自行修改

./configure --prefix=$HOME/meme --with-url=http://meme-suite.org --enable-build-libxml2 --enable-build-libxslt

make

make test

make install


  • 添加环境变量到 .bashrc 中


export PATH=$HOME





请到「今天看啥」查看全文