序列 motif 就是一段有功能的、特定模式的序列,它之所以可以具有生物学功能,是因为它可以和调控蛋白结合,如转录因子、核糖体等。
有的时候我们在做基因共表达分析的时候,往往会对同一模块(共表达模块)的基因进行启动子富集,验证他们是否收到共同的启动子调控,这样就用到了启动子富集分析。
软件 meme(http://meme-suite.org/tools/meme) 可以从序列中找到新的、没有 gap 的 motifs,其输入文件可以是 DNA、RNA 或蛋白质序列。该软件的在线版限制序列大小为 60,000 bp ,在使用上有一定的局限性,这里介绍其本地版的用法。
安装
meme 的安装方法如下:
tar zxf meme_4.12.0.tar.gz
cd meme_4.12.0
# --prefix 指定 meme 的安装路径,路径可自行修改
./configure --prefix=$HOME/meme --with-url=http://meme-suite.org --enable-build-libxml2 --enable-build-libxslt
make
make test
make install