专栏名称: 生信人
共同学习生物信息学知识,共同探究生物奥秘。
目录
相关文章推荐
生物学霸  ·  师姐秘传 3D 细胞培养 protocol ... ·  2 天前  
生物制品圈  ·  康诺亚GPRC5DxCD3双抗首次在华获批临床 ·  1 周前  
生物学霸  ·  芬兰最高学府降低博士毕业标准,2 ... ·  6 天前  
51好读  ›  专栏  ›  生信人

Cancer Cell最新观点:十年人类肿瘤单细胞RNA测序的经验教训

生信人  · 公众号  · 生物  · 2024-09-21 07:05

正文

人类肿瘤是由在复杂的肿瘤微环境中进化的不同基因克隆和恶性细胞状态组成的复杂生态系统单细胞RNA测序(scRNA-seq)在过去十年中使我们理解肿瘤生物学的能力发生了翻天覆地的革命。今天,小编要和大家分享一2024年9月发表在Cancer Cell(IF:48.8)上的文章,回顾了scRNA-seq在人类肿瘤研究中的第一个十年,并强调了从这些研究中得出的一些值得关注和思考的见解。

添加微信

精彩推送不错过


介绍

十年前,专业实验室通过 scRNA-seq对人类癌症样本进行了初步研究。这些早期研究对通过流式细胞术分离到孔中或通过微流体装置分离到不同室中的单细胞进行了分析。虽然这些研究提供了对癌症和免疫细胞表达程序的详细见解,但它们受到可扩展性的限制,通常每个样本只有几十或数百个细胞。随着微滴等高通量方法的开发以降低的成本,研究人员能够对数千个细胞进行 3' 端或 5' 端并行测序。


基于微滴的系统已成为最广泛使用的高通量scRNA-seq平台。组合条形码 (SPLiT-seq)实现了规模的进一步发展。基于纳米井的系统提供了有趣的便携性和细胞成像的可能性。虽然与液滴微流控相比,基于流式细胞术的分选在规模上仍然有限,但它仍然是细胞选择、多组学分析(例如 RNA + DNA)和全长测序的首选方法。总体而言,这些进展使大多数实验室都可以使用高通量scRNA-seq,并导致scRNA-seq癌症研究的数量逐渐增加,并在 2020 年左右达到顶峰,此后一直保持较高水平,产生了大量有关肿瘤转录水平的异质性的数据和文章。


区分肿瘤间与肿瘤内表达异质性

一组肿瘤的单细胞表达谱可用于定义每种观察到的细胞类型的肿瘤间和肿瘤内异质性。然而,当涉及恶性细胞表达程序时(但通常不是免疫细胞和基质细胞),肿瘤间异质性往往更明显。例如,来自一组肿瘤的所有恶性细胞的表达聚类通常会导致该组中的每个肿瘤产生单独的簇。这凸显了肿瘤间表达异质性非常高,反映了每个肿瘤独特的遗传学以及其他潜在影响,例如肿瘤的细胞起源、空间位置和病史以及各种其他患者特征。因此,从癌症队列的scRNA-seq数据集中直接分析细胞状态可能会以肿瘤特异性模式为主,并可能掩盖肿瘤内的多样性。


通过使用旨在消除技术批次效应的整合方法,可以减少肿瘤间异质性的巨大贡献。然而,这可能会扭曲数据,消除真正的生物信号。因此,除了前面提到的两种方法(直接组合来自多个患者的数据或将其与专用方法集成)之外,第三种方法涉及对每个肿瘤进行单独分析,以便直接定义肿瘤内异质性,而不会将其与肿瘤间异质性混淆。在该方法中,首先在每个肿瘤内单独定义肿瘤内异质性,并且仅随后,可以在肿瘤之间比较所得模式,以便识别复发模式或特定肿瘤或癌症类型所独有的模式。


鉴于肿瘤间和肿瘤内异质性之间的复杂关系,作者将后续部分重点关注基因表达水平的肿瘤内模式,并将其称为表达肿瘤内异质性(eITH)。


从scRNA-seq定义eITH:簇、伪时间和程序分数

根据 scRNA-seq 数据,在一份肿瘤样本中发现了多少个不同的癌细胞亚群?这个看似简单、意料之中的问题却很难解决。根本原因是,恶性细胞通常跨越一系列转录程序,而不是一组良好分离的簇(图 1 A)。这种连续体反映了一系列细胞状态,而不是可以更好地描述为细胞类型的离散簇。


表达连续体提高了细胞可能随时间动态改变其状态的可能性,因此细胞群可能涵盖一系列观察到的细胞状态。这种动态行为可能是单向的,例如谱系分化,也可能是多向的,这个概念通常被称为癌细胞可塑性。这种可塑性在许多情况下都得到了证明,包括黑色素瘤、神经胶质瘤、胰腺癌和前列腺癌。因此,近年来,癌细胞可塑性受到越来越多的关注,包括将其定义为癌症的标志,并作为癌症的重大挑战之一。可塑性意味着,即使我们成功地针对癌细胞的特定状态,这种状态也可能被其他癌细胞再生,这就需要基于对细胞状态的动力学和决定因素的更好理解的新的治疗策略。


有了对癌细胞动态行为的认识,聚类的一种常见替代方法是沿着观察到的连续体对癌细胞进行排序,并将每个细胞与其沿着该排序的位置相关联(图 1 B)。这种排序通常称为伪时间,基于最初为开发环境设计的方法,其中细胞确实沿着确定的状态路径前进,反映了它们的分化或成熟。


伪时间方法非常适合连续体,但在癌症背景下面临两个额外的挑战。首先,与发育环境不同,尚不清楚癌细胞是否确实沿着连续体的一个方向前进,或者它们是否可以向多个方向前进。其次,虽然分化意味着细胞沿着一组定义的状态进展,但在癌症背景下,细胞可能同时沿着多个轴移动。


因此,伪时间的替代方案涉及对癌细胞进行多种表达程序的“评分”(图 1C )。相关表达程序首先可以定义为在给定类型的多个肿瘤中反复变化的表达程序,因此反映了eITH在该背景下的一致特征。然后可以通过一组程序分数来描述每个单元,这些程序分数可以进行进一步的分析,包括如果需要的话进行聚类。这种方法消除了方向性的基本假设,被认为更适合癌症中存在的多维动态。


然而,这种“评分”的方法提出了几个问题。例如,哪些程序在特定肿瘤内有所不同?哪些程序在许多肿瘤中始终存在差异?可变程序的身份如何取决于癌症类型?这些问题涉及一个基本问题,即特定肿瘤中癌细胞的哪些过程和表型往往会发生变化。

1. eITH 分析方法

最常见的eITH:细胞周期和压力

癌细胞最基本的特性是它们的增殖率增加,因此任何肿瘤都预计含有增殖的癌细胞。由于scRNA-seq捕获静态快照,因此进一步预计只有少数癌细胞在细胞周期中会被分析。因此,最常见的eITH模式是循环细胞和非循环细胞之间的区别。


循环细胞可以进一步分为细胞周期的不同阶段。其中,G1/S和G2/M期在不同类型的癌症和非癌细胞之间高度一致。基于这两个程序的相对激活,细胞可以被分配到细胞周期的不同阶段,不表达这两个程序的细胞可以被认为是非循环的。


第二个最常见的eITH模式是细胞应激相关程序,例如缺氧相关反应、热休克反应和未折叠蛋白反应等,肿瘤中还有各种其他与应激相关的表达谱。尽管生理应激具有多样性,但观察到的与应激相关的程序通常共享一组共同的基因,从而定义了似乎由多种刺激诱导的通用应激程序,因此通常难以解释。


此外,不同的肿瘤区域使细胞承受不同的压力,例如缺氧、竞争导致的营养限制、热、酸度等。事实上,最近的研究已经开始证明癌细胞状态往往是空间隔离的, 反映了空间组学领域的快速扩展。


eITH部分反映发育和生理过程

癌症中最常见的发育(和生理)过程的例子可能是上皮-间质转化(EMT)。 EMT已在癌症领域得到广泛研究,人们认为EMT可以赋予癌细胞增加转移潜力、耐药性和可能的免疫抑制能力。大量scRNA-seq研究在所有类型的上皮癌中都检测到了富含间充质相关基因的eITH程序。此外,在各种类型的非上皮癌类型中也检测到了间充质相关程序。因此,与增殖和激活应激反应的能力一样,产生间充质相关反应的能力似乎也是不同类型癌症中癌细胞的共同特征。


EMT的例子强调了一个更广泛的现象:eITH往往类似于发育和生理过程,但通常只反映这些过程的部分版本,可能缺乏规范标记,其表型后果难以评估。例如,多种上皮癌类型,尤其是鳞状细胞癌,通常含有表达与衰老上皮细胞高度相似的程序的细胞亚群。这些细胞似乎不会激活经典的衰老标志物(例如,p16 和 p21),并且它们似乎保持增殖能力,尽管与同一肿瘤中的其他细胞相比有所降低。


总而言之,scRNA-seq研究表明,癌细胞经常会诱导正常发育或生理学程序的扭曲版本,并强调癌症程序往往反映其正常对应程序的有限版本,因此使它们的检测和解释变得复杂(图2)。

2. 癌症eITH通常反映发育或生理程序的有限版本

与免疫细胞相互作用相关的eITH

随着人们对免疫疗法的普遍兴趣,肿瘤scRNA-seq研究的大部分注意力都集中在免疫细胞上。已知MHC-I基因的表达在某些癌症中受到破坏,反映了免疫逃避的机制,但这些基因很少在eITH中被诱导。相反,MHC-II基因通常由癌细胞诱导,通常与经典的干扰素反应基因(例如ISG15 、 IFIT3 、 STAT1和OAS1)一起。事实上,在大多数癌症类型中,干扰素反应基因与MHC-II 基因高度相关,因此检测到的eITH通常包含这两组基因(干扰素反应 + MHC-II 基因)。这种紧密耦合可能表明干扰素是由T细胞和其他免疫细胞分泌的,然后诱导相邻癌细胞协调表达这些基因组。


MHC-II基因的诱导不仅限于癌细胞亚群,还在TME内的各种细胞类型中观察到。除了巨噬细胞和树突状细胞之外,在成纤维细胞和内皮细胞亚群中也观察到高MHC-II。然而,在这些细胞类型中,MHC-II 表达与干扰素反应无关,表明非上皮细胞类型中 MHC-II 基因和干扰素反应的调节模式不同。


MHC-II 和许多干扰素反应基因有时被视为免疫基因,甚至被视为APC的标记,因为它们传统上由免疫细胞类型表达。但如前所述,它们也在癌细胞和其他 TME细胞亚群中被诱导类型,因此在解释大量样本中此类基因的表达谱以及应用反卷积来评估免疫细胞类型频率时要谨慎。


利用单细胞特征对批量轮廓进行反卷积

已发表的大量肿瘤scRNA-seq数据集意味着大多数与癌症相关的细胞类型和细胞状态可能已经被描述。细胞类型和细胞状态的相应特征可用于改进批量RNA-seq的反卷积分析。反卷积是指估计样本中的细胞类型和细胞状态频率,以便所有这些细胞的组合表达谱将为观察到的批量RNA-seq 谱提供最佳的拟合。这种方法近年来被广泛应用,促进从大量RNA-seq数据集中考虑整个肿瘤生态系统。


然而,反卷积方法存在局限性。正如scRNA-seq 数据集所证明的,被视为某种细胞类型(或细胞状态)标记的基因几乎从未完全局限于这些细胞,而是也由多种其他细胞类型/状态表达(尽管水平较低)。这种“非规范”表达的确切程度在细胞类型、样本和研究之间存在显着差异,其方式无法通过反卷积方法完全预测,因此限制了其准确性。


eITH注释的挑战和前景

其他未讨论但仍常见的eITH包括与全局蛋白质调节、呼吸、MYC 激活和分泌相关的程序。然而,考虑到eITH定义和命名的模糊性,许多研究中报告的eITH可能看起来截然不同,并且可能很难归入任何这些类别。此外,即使对于一组明确定义的特征基因,也常常存在各种功能基因集的串扰(例如,与发育和代谢过程相关),因此,不同的研究人员可以根据他们的研究不同地对特征进行不同的命名。


肿瘤样本的scRNA-seq已经成熟,下一个前沿是在临床中更广泛地结合这些方法。snRNA-seq开启了对速冻样本(来自生物库或前瞻性收集)进行分析的可能性。虽然与scRNA-seq相比,snRNA-seq提供的基因数较低且基因表达略有不同,但snRNA-seq和scRNA-seq强调的生物过程是一致的,为分析大型临床组织标本集合提供了实用且可扩展的解决方案。


最近的另一个关键进展是使用福尔马林固定甚至FFPE(福尔马林固定、石蜡包埋)块进行scRNA-seq和空间分析的可能性。最近的方法(snPATHO-seq,snFFPE-seq和snRandome-seq)通过优化RNA提取和/或利用随机引物改进了 FFPE 分析。

此外,单细胞方法从RNA分析扩展到同一细胞的多种模式(基因组、表观基因组、转录组、蛋白质组和/或代谢组)的联合分析。


最后,空间分析方法有望彻底改变癌症研究。细胞在每个特定状态下的确切位置将有助于揭示驱动该状态的机制。自2015年至2016 年发表第一份空间转录组学研究以来,空间转录组学领域一直在急剧扩展,多种方法可提供更高的分辨率,这些方法要么基于成像(通常基于杂交探针,例如 CosMx和Xenium),要么基于测序(在原位索引之后,例如 Slide-标签和Visium HD)。


添加微信

精彩推送不错过


最新文章汇总(持续更新ing)


最新热点方向

1、这个科研方向已经不适合临床医生

2、Science:脊髓损伤后的神经再生重大突破

3、全网最全!哈佛生信女神刘小乐团队研究成果汇总

4、Cell Stem Cell最新综述:肿瘤干性的标志

5、Cell重磅:樊嘉院士、高强教授联合发表!中性粒细胞又有新状态了!


生信人课堂

1、多组学水平的孟德尔随机化分析套路

2、单细胞+空转王炸组合,探索骨骼肌纤维化巨噬细胞

3、以小博大,紧张刺激:肿瘤耐药研究,从基因到网络

4、零基础入门-单细胞课程

5、史上最全格局打开,细讲基因组学,确定不来学学?


课题设计 | 生信分析 | 数字产品

概普生物 让科研丰富

生信人

专注于基因技术相关知识分享
扫码关注 获取更多