cellranger multi—手把手教你单细胞免疫组库定量

生信菜鸟团 · 公众号 · 生物 · 2025-03-18 19:04

正文

工欲善其事必先利其器

单细胞免疫组库

单细胞免疫组库 是一种基于单细胞测序技术的高精度研究方法，用于解析免疫细胞（如T细胞、B细胞）的抗原受体（TCR/BCR）序列及其转录组特征。传统bulk测序无法揭示细胞异质性，而单细胞技术可精准识别克隆型分布、分化轨迹及功能状态，为免疫机制研究提供分子级分辨率。

10X Genomics 通过其Chromium平台开发了专为免疫组库设计的解决方案（如10x Chromium Single-Cell V(D)J Assay），可在单细胞层面同时获取全长配对 V (D) J 序列、基因表达、细胞表面蛋白表达和抗原特异性数据。该检测方法将数千个细胞分隔到乳液包裹凝胶微珠（GEMs）中，单个液滴内生成的所有互补 DNA（cDNA）都具有相同的 10X Barcode。从 cDNA 构建文库并进行测序，根据10X Barcode将每条读取的序列追溯到其对应的单个cell，实现大规模单细胞水平免疫受体库的深度解析，支持克隆演化、抗原特异性响应及免疫治疗靶点发现。

分析环境

同10X单细胞转录组，10X Genomics 也提供了完善的分析 pipeline 。

https://www.10xgenomics.com/support/software/cell-ranger/latest/analysis/running-pipelines/cr-5p-multi

首先用的软件还是 cellranger ,前面也多次介绍，并且共享服务器也有提供现成的软件和参考基因组，可以直接调用。【服务器详情见：满足你生信分析计算需求的低价解决方案】

如果需要自己下载，也可以直接在官网下载：

https://www.10xgenomics.com/support/software/cell-ranger/downloads

wget -O cellranger-9.0.1.tar.gz "https://cf.10xgenomics.com/releases/cell-exp/cellranger-9.0.1.tar.gz?Expires=1742333081&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA&Signature=aSXlUageSwcEjNHFjw6JGYuf6ccW7AAe5uVmOJ4YrH~fX28OCPGGb4q5pJ7tFYSSvz6f4vv-35D0G4tOLIvG7ptV8k8EQhjVFnVzU9OEY4yZ1qPNVcB0UR~qnRvego4~diZrKz0covGULCVNf~l4lmnPtlNnbM7Z2O4A2~x~2be3peRTchZ4eLC7PUJhVFFHPABx4fVqlMabd6g2wabJQuuxg37r1uXuxoOim3YlOs2lbN4Nm~LTpZ6BdK3M7-Ai9AOMCmwmut41mi-h32rJgZT9M0Ga~LpKatCgOysCHkwCQNe-CNyv1X~h44ipI18NCpvxoSN3VVJbb8SHzVQgBg__"

其次是所需的参考基因组文件

#human 
wget "https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-GRCh38-2024-A.tar.gz"
wget "https://cf.10xgenomics.com/supp/cell-vdj/refdata-cellranger-vdj-GRCh38-alts-ensembl-7.1.0.tar.gz"

免疫组库定量

定量脚本

根据官方文档，我们可以很容易写出我们所需的定量脚本：

$cat ~/scRNAseq_pipeline/st3_cellranger9_vdj_multi.sh
#! /bin/bash -xe
#

bin=/home/username/software/cellranger-9.0.1/cellranger

/usr/bin/time -v $bin multi --id=${1} \
--csv=${2} \
--localcores=4 \
--localmem=50

准备输入文件

从定量脚本，可以看出对于整个pipeline最主要的就是准备一个样本信息的csv文件。根据文档信息：

https://www.10xgenomics.com/support/software/cell-ranger/latest/analysis/running-pipelines/cr-5p-multi

如果少量样本，我们按示例格式手动修改即可。例如：

$cat C1008587.csv
[gene-expression]
reference,/home/username/reference/human/refdata-gex-GRCh38-2024-A
create-bam,false

[vdj]
reference,/home/username/reference/human/refdata-cellranger-vdj-GRCh38-alts-ensembl-7.1.0

[libraries]
fastq_id,fastqs,feature_types
C1008587,/home/username/project/b_scrna,Gene Expression
C1008587_BCR,/home/username/project/b_rawdata/C1008587_BCR,VDJ-B
C1008587_TCR,/home/username/project/b_rawdata/C1008587_TCR,VDJ-T

提交定量任务

## 单样本提交后台
nohup bash /home/usernam/scRNAseq_pipeline/st3_cellranger9_vdj_multi.sh C1008587 /home/usernam/project/cellrgr9/C1008587.csv 1>log_C1008587.txt 2>&1 &

多样本批处理

如果有多个样本，那么再手动逐一修改csv文件就会显得很低效了。这时候就需要考虑如何快速批量生成样本对应的csv文件。

这边提供一个思路是：

对应每个样本的csv文件我们需要变动的地方也只是 libraries
先做一个头文件
批量生成后面的信息，最后合并成一个完整的csv文件

首先根据自己的参考基因组和vdj参考文件新建一个 head.txt