专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
目录
相关文章推荐
生信宝典  ·  微生物组-宏基因组分析专题研讨会 ... ·  昨天  
生物制品圈  ·  A股IPO排队医药企业名单:仅17家等待上市 ... ·  2 天前  
生物学霸  ·  支持「医科大学」,争创「双一流」 ·  3 天前  
BioArt  ·  Nat Cardiovasc ... ·  3 天前  
51好读  ›  专栏  ›  生信菜鸟团

玩转服务器—零帧起手单细胞上下游分析

生信菜鸟团  · 公众号  · 生物  · 2025-02-11 20:44

正文

滴水穿石 非一日之功


随着单细胞转录组学的蓬勃发展,研究人员产生的数据量呈爆发式增长,这无疑对分析设备提出了更高的要求。如果您在设备资源方面有所限制,不妨看一下如何借助共享服务器快速开展单细胞转录组学的上下游分析工作。

初始账号状态

关于服务器如何购买,见: 满足你生信分析计算需求的低价解决方案 。拿到账号登录后家目录状态如下:【登录方式详见 玩转服务器1—共享服务器登录指北

新账号登录
新账号登录
image.png

初始账号默认会配置conda镜像,R公共库以及pip镜像

conda 安装

安装软件往往是个麻烦的事情,对于刚入门学习用户,我们通常建议直接使用conda来管理自己的软件环境。为此我们也专门配置了内网的conda镜像,详见玩转服务器12-从卡顿到秒装,Conda焕新极速体验。理论上也不需要再设置 .condarc 。可以说是安装即用。

##安装conda
wget -c https://mirrors.pku.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh

bash Miniconda3-latest-Linux-x86_64.sh
##问「yes|no」:输入yes ;没有问「yes|no」直接按回车
##查看软件的知情同意,按 q 可直接退出查看

source ~/.bashrc

原始数据

如果是公共数据库的数据,可以直接下载到服务器。

##kingfisher安装
conda create -n kingfisher
conda activate kingfisher
conda install kingfisher
conda install -c hcc aspera-cli -y

#
#iseq安装
conda create -n iseq
conda install iseq -y

如果是自己测的数据,需要上传数据到服务器可以参考: 玩转服务器—数据上传与下载

10X单细胞定量

10X单细胞上游定量使用的是cellranger,官网下载解压即可使用。为了方便大家使用,我们共享服务器也已经提供了软件和不同的参考基因组。用户可以直接拷贝使用。

公共库
公共库
mkdir biosoft reference

#
cellranger软件
cp /refdir/database/cellranger/cellranger-8.0.0.tar.gz ~/biosoft
tar -xf cellranger-8.0.0.tar.gz 

#
参考基因组(可按需选择)
cp /refdir/database/cellranger/refdata-gex-GRCh38-2024-A.tar.gz ~/reference/
tar -xf refdata-gex-GRCh38-2024-A.tar.gz 
软件
软件
参考基因组文件
参考基因组文件

软件和参考基因组文件准备好后,然后就是进行单细胞定量。定量脚本也多次介绍,详见: 玩转服务器—运行Cell Ranger你必须知道的两个参数

#! /bin/bash -xe
#
bin=/home/data/t030659/biosoft/cellranger-8.0.0/cellranger
db=/home/data/t030659/reference/refdata-gex-GRCh38-2024-A
ls $bin; ls $db

fq_dir=${2}
/usr/bin/time -v $bin count --id=$1 \
        --localcores=4 \
        --localmem=50 \
        --transcriptome=$db \
        --fastqs=$fq_dir \
        --sample=$1   \
        --create-bam=false \
        --expect-cells=5000

单细胞下游分析

定量结束后,可以得到10X单细胞标准三文件,下一步通常是走Seurat分析流程。对此共享服务器也已经配置好了Rstudio-server。在浏览器登录后就是熟悉的图形界面。只要你对Rstudio熟悉,就可以无缝衔接进行后续分析。

Rstudio-server登录
Rstudio-server登录
Rstudio-server登录成功
Rstudio-server登录成功

加载分析所用R包。

library(COSG)
# devtools::install_github('genecell/COSGR')
library(harmony)

library(ggsci)
library(dplyr) 
library(future)
library(Seurat)
library(clustree)
library(cowplot)
library(data.table)
library(dplyr)
library(ggplot2)
library(patchwork)
library(stringr)

服务器公共R包库基本包含了常用的R包,如果有缺少的,也可以很方便的自己安装。详见: 玩转服务器—共享服务器R包调用与安装

clustree安装
clustree安装
COSG安装
COSG安装

下游的代码我们也多次分享:







请到「今天看啥」查看全文