随着单细胞转录组学的蓬勃发展,研究人员产生的数据量呈爆发式增长,这无疑对分析设备提出了更高的要求。如果您在设备资源方面有所限制,不妨看一下如何借助共享服务器快速开展单细胞转录组学的上下游分析工作。
初始账号状态
关于服务器如何购买,见:
满足你生信分析计算需求的低价解决方案
。拿到账号登录后家目录状态如下:【登录方式详见
玩转服务器1—共享服务器登录指北
】
新账号登录
初始账号默认会配置conda镜像,R公共库以及pip镜像
conda 安装
安装软件往往是个麻烦的事情,对于刚入门学习用户,我们通常建议直接使用conda来管理自己的软件环境。为此我们也专门配置了内网的conda镜像,详见玩转服务器12-从卡顿到秒装,Conda焕新极速体验。理论上也不需要再设置
.condarc
。可以说是安装即用。
# #安装conda wget -c https://mirrors.pku.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh bash Miniconda3-latest-Linux-x86_64.sh# #问「yes|no」:输入yes ;没有问「yes|no」直接按回车 # #查看软件的知情同意,按 q 可直接退出查看 source ~/.bashrc
原始数据
如果是公共数据库的数据,可以直接下载到服务器。
# #kingfisher安装 conda create -n kingfisher conda activate kingfisher conda install kingfisher conda install -c hcc aspera-cli -y ##iseq安装 conda create -n iseq conda install iseq -y
如果是自己测的数据,需要上传数据到服务器可以参考:
玩转服务器—数据上传与下载
10X单细胞定量
10X单细胞上游定量使用的是cellranger,官网下载解压即可使用。为了方便大家使用,我们共享服务器也已经提供了软件和不同的参考基因组。用户可以直接拷贝使用。
公共库
mkdir biosoft reference #cellranger软件 cp /refdir/database/cellranger/cellranger-8.0.0.tar.gz ~/biosoft tar -xf cellranger-8.0.0.tar.gz #参考基因组(可按需选择) cp /refdir/database/cellranger/refdata-gex-GRCh38-2024-A.tar.gz ~/reference/ tar -xf refdata-gex-GRCh38-2024-A.tar.gz
软件
参考基因组文件
软件和参考基因组文件准备好后,然后就是进行单细胞定量。定量脚本也多次介绍,详见:
玩转服务器—运行Cell Ranger你必须知道的两个参数
# ! /bin/bash -xe # bin=/home/data/t030659/biosoft/cellranger-8.0.0/cellranger db=/home/data/t030659/reference/refdata-gex-GRCh38-2024-A ls $bin; ls $db fq_dir=${2} /usr/bin/time -v $bin count --id=$1 \ --localcores=4 \ --localmem=50 \ --transcriptome=$db \ --fastqs=$fq_dir \ --sample=$1 \ --create-bam=false \ --expect-cells=5000
单细胞下游分析
定量结束后,可以得到10X单细胞标准三文件,下一步通常是走Seurat分析流程。对此共享服务器也已经配置好了Rstudio-server。在浏览器登录后就是熟悉的图形界面。只要你对Rstudio熟悉,就可以无缝衔接进行后续分析。
Rstudio-server登录
Rstudio-server登录成功
加载分析所用R包。
library (COSG)# devtools::install_github('genecell/COSGR') library (harmony)library (ggsci)library (dplyr) library (future)library (Seurat)library (clustree)library (cowplot)library (data.table)library (dplyr)library (ggplot2)library (patchwork)library (stringr)
服务器公共R包库基本包含了常用的R包,如果有缺少的,也可以很方便的自己安装。详见:
玩转服务器—共享服务器R包调用与安装
clustree安装
COSG安装
下游的代码我们也多次分享: