单细胞免疫组库
单细胞免疫组库
是一种基于单细胞测序技术的高精度研究方法,用于解析免疫细胞(如T细胞、B细胞)的抗原受体(TCR/BCR)序列及其转录组特征。传统bulk测序无法揭示细胞异质性,而单细胞技术可精准识别克隆型分布、分化轨迹及功能状态,为免疫机制研究提供分子级分辨率。
10X Genomics 通过其Chromium平台开发了专为免疫组库设计的解决方案(如10x Chromium Single-Cell V(D)J Assay),可在单细胞层面同时获取全长配对 V (D) J 序列、基因表达、细胞表面蛋白表达和抗原特异性数据。该检测方法将数千个细胞分隔到乳液包裹凝胶微珠(GEMs)中,单个液滴内生成的所有互补 DNA(cDNA)都具有相同的 10X Barcode。从 cDNA 构建文库并进行测序,根据10X Barcode将每条读取的序列追溯到其对应的单个cell,实现大规模单细胞水平免疫受体库的深度解析,支持克隆演化、抗原特异性响应及免疫治疗靶点发现。
分析环境
同10X单细胞转录组,10X Genomics 也提供了完善的分析 pipeline 。
-
https://www.10xgenomics.com/support/software/cell-ranger/latest/analysis/running-pipelines/cr-5p-multi
首先用的软件还是 cellranger ,前面也多次介绍,并且共享服务器也有提供现成的软件和参考基因组,可以直接调用。【服务器详情见:
满足你生信分析计算需求的低价解决方案
】
共享服务器
如果需要自己下载,也可以直接在官网下载:
-
https://www.10xgenomics.com/support/software/cell-ranger/downloads
wget -O cellranger-9.0.1.tar.gz "https://cf.10xgenomics.com/releases/cell-exp/cellranger-9.0.1.tar.gz?Expires=1742333081&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA&Signature=aSXlUageSwcEjNHFjw6JGYuf6ccW7AAe5uVmOJ4YrH~fX28OCPGGb4q5pJ7tFYSSvz6f4vv-35D0G4tOLIvG7ptV8k8EQhjVFnVzU9OEY4yZ1qPNVcB0UR~qnRvego4~diZrKz0covGULCVNf~l4lmnPtlNnbM7Z2O4A2~x~2be3peRTchZ4eLC7PUJhVFFHPABx4fVqlMabd6g2wabJQuuxg37r1uXuxoOim3YlOs2lbN4Nm~LTpZ6BdK3M7-Ai9AOMCmwmut41mi-h32rJgZT9M0Ga~LpKatCgOysCHkwCQNe-CNyv1X~h44ipI18NCpvxoSN3VVJbb8SHzVQgBg__"
其次是所需的参考基因组文件
#human
wget "https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-GRCh38-2024-A.tar.gz"
wget "https://cf.10xgenomics.com/supp/cell-vdj/refdata-cellranger-vdj-GRCh38-alts-ensembl-7.1.0.tar.gz"
免疫组库定量
定量脚本
根据官方文档,我们可以很容易写出我们所需的定量脚本:
$cat ~/scRNAseq_pipeline/st3_cellranger9_vdj_multi.sh
#! /bin/bash -xe
#
bin=/home/username/software/cellranger-9.0.1/cellranger
/usr/bin/time -v $bin multi --id=${1} \
--csv=${2} \
--localcores=4 \
--localmem=50
准备输入文件
从定量脚本,可以看出对于整个pipeline最主要的就是准备一个样本信息的csv文件。 根据文档信息:
-
https://www.10xgenomics.com/support/software/cell-ranger/latest/analysis/running-pipelines/cr-5p-multi
如果少量样本,我们按示例格式手动修改即可。例如:
$cat C1008587.csv
[gene-expression]
reference,/home/username/reference/human/refdata-gex-GRCh38-2024-A
create-bam,false
[vdj]
reference,/home/username/reference/human/refdata-cellranger-vdj-GRCh38-alts-ensembl-7.1.0
[libraries]
fastq_id,fastqs,feature_types
C1008587,/home/username/project/b_scrna,Gene Expression
C1008587_BCR,/home/username/project/b_rawdata/C1008587_BCR,VDJ-B
C1008587_TCR,/home/username/project/b_rawdata/C1008587_TCR,VDJ-T
提交定量任务
## 单样本提交后台
nohup bash /home/usernam/scRNAseq_pipeline/st3_cellranger9_vdj_multi.sh C1008587 /home/usernam/project/cellrgr9/C1008587.csv 1>log_C1008587.txt 2>&1 &
多样本批处理
如果有多个样本,那么再手动逐一修改csv文件就会显得很低效了。这时候就需要考虑如何快速批量生成样本对应的csv文件。
这边提供一个思路是:
-
对应每个样本的csv文件我们需要变动的地方也只是
libraries
-
-
批量生成后面的信息,最后合并成一个完整的csv文件
首先根据自己的参考基因组和vdj参考文件新建一个
head.txt