咱们的单细胞授课交流群有小伙伴提问单端的单细胞转录组数据该如何跑上游的定量呢,而且是10x技术流!
我看了看学员提供的文献:《Reinvigoration of cytotoxic T lymphocytes in microsatellite instability-high colon adenocarcinoma through lysosomal degradation of PD-L1》,确实是有点迷,因为里面根本就完全不提单细胞转录组数据处理细节问题:
不提单细胞转录组数据处理细节问题
在文献的附件,勉强可以看到一点点单细胞转录组建库和测序的描述,是常规的10x技术和illumina测序,而且明明是双端测序啊 :
一点点单细胞转录组建库和测序的描述
在DNA测序中,双端测序(Paired-end sequencing)和单端测序(Single-end sequencing)是两种不同的测序策略,它们的主要区别在于读取DNA片段的方式和产生的数据类型。以下是这两种测序方法的详细比较:
单端测序
:在单端测序中,测序仪只读取DNA片段的一端的序列信息。这通常涉及到将DNA片段的一端固定在测序平台上,然后读取该端的序列。
双端测序
:在双端测序中,测序仪读取DNA片段两端的序列信息。这意味着DNA片段的两端都被固定在测序平台上,并且两端的序列都被读取。
双端测序产生的数据量通常是单端测序的两倍,因为它提供了两个序列读取。
双端测序可以提供更高的覆盖度,因为它从两个方向上覆盖了DNA片段,这有助于提高数据的准确性和可靠性。
为什么学员会错认为它是单端呢?
我们从文献里面的链接进去看看:https://ngdc.cncb.ac.cn/gsa/search/getSearchByAccession
里面是3个样品:
https://ngdc.cncb.ac.cn/gsa/browse/CRA017219/CRR1207644
https://ngdc.cncb.ac.cn/gsa/browse/CRA017219/CRR1207643
https://ngdc.cncb.ac.cn/gsa/browse/CRA017219/CRR1207645
而且里面写的是:
Illumina HiSeq X Ten ssRNA-Seq TRANSCRIPTOMIC SINGLE CELL PCR SINGLE
首先是测序仪就不太对,然后是单端双端肯定是有问题,最后我第一次看到ssRNA-Seq的简称 :
image-20240907123939623
如果是正常的10x技术的单细胞转录组
正常走cellranger的定量流程即可,代码我已经是多次分享了。参考: