专栏名称: 生信技能树
生物信息学学习资料分析,常见数据格式及公共数据库资料分享。常见分析软件及流程,基因检测及癌症相关动态。
目录
相关文章推荐
新智元  ·  Ilya又回来了!神秘初创SSI估值200亿 ... ·  昨天  
爱可可-爱生活  ·  【[99星]Ollama模型直链生成与安装工 ... ·  昨天  
爱可可-爱生活  ·  【[74星]EasyDeploy:一站式大规 ... ·  昨天  
爱可可-爱生活  ·  通俗版解读 查看图片-20250207090641 ·  2 天前  
宝玉xp  ·  GitHub Copilot 现在也支持 ... ·  2 天前  
51好读  ›  专栏  ›  生信技能树

这得什么样配置的服务器才能分析这个数据

生信技能树  · 公众号  ·  · 2024-10-26 23:47

正文


Title The genomic landscape of 2,023 colorectal cancers
Online https://www.nature.com/articles/s41586-024-07747-9

研究背景

CRC 是全球第三大最常见的恶性肿瘤,是导致死亡的常见原因。基于英国 100kGP 计划,研究团队开展了全球最大规模的 CRC 全基因组队列分析计划。

研究方法

  • 患者和样本:由英格兰 100,000 基因组计划 (100kGP) 招募,对 2023 个冷冻肿瘤样本,包括来自 2,017 例患者的 1,898 例原发性肿瘤、122 例转移和 3 例原发性肿瘤复发。6 例患者 (均为 MSS) 对原发性肿瘤和转移样本进行了测序。配对血液样本进行 WGS 测序,计划肿瘤样本平均测序深度 100x,正常配对血液样本 33x

  • 测序策略:HiSeqX平台,150bp 双端测序

  • 数据处理:先采用 Illumina's North Star pipeline 对数据进行预处理,Isaac 比对到 GRCh38 参考基因组上。然后用Strelka2 call SNV 和 Indel,并基于若干指标进行过滤,结果用 VEP 进行注释。

  • 高级分析:使用 MSINGS 评估肿瘤样本的 MSI 状态,基于此评估 POLE 和 POLD1 基因的突变(somatic和 germline)的影响;使用R包 CleanCNA call somatic CNA,基于 Battenberg 的CNA结果;结构变异则采用 Delly、Lumpy、Manta 共同 call SV;IntOGen流程(包含7种驱动基因鉴定方法)来评估驱动突变;SigProfilerMatrixGenerator评估突变特征;新抗原预测等。

  • 用到的软件:作者非常贴心的把分析用到的软件、版本、链接整理到了文件附件了

研究结果

CRC分型:基于突变结果,先分为3类:MSI(微卫星不稳定性阳性,错配修复缺陷 ;n = 364);POL(DNA 聚合酶ε校对缺陷; n =18);和 MSS(微卫星稳定;n = 1,641),从Fig S1 可以看到,每一亚型的 TMB 水平,突变特征都有较为明显的不同。但是因为 MSS 中既有原发灶也有转移灶,因此作者进行细分,MSS 原发和MSS转移。在所有转移灶中,只有3例不属于MSS。

CRC驱动基因和结构变异图谱:MSS 原发性、 MSI (所有原发性)、POL (所有原发性) 和 MSS 转移 CRC 中分别进行碱基对水平的驱动基因鉴定,检测到 193 个 CRC 驱动基因,其中有57个驱动基(Fig1a)因在不止一个分组(亚型)中检测到,另外136个驱动基因仅在一个分组(亚型)中检测到。

作者为了探索罕见癌症亚组,进一步细分亚型,研究团队又将样本分为了:MSI; POL; and four MSS clusters. 这里采用的是基于 304 个分子信息和临床变量进行聚类的,4个 MSS 聚类分别为:WGD-A (24% of primary treatment-naive MSS), WGD-B (40%), genome stable (GS; 21%) and loss of heterozygosity (LOH; 15%),聚类信息Fig2a里有 SNV Indel SV CNA 的热图,是将每一种突变负荷量化得到的。

免疫逃逸分析:最常检测到的 CRC 驱动突变往往具有低免疫原性潜力,即驱动突变在免疫原性潜力低的患者中富集(Fig3a)。







请到「今天看啥」查看全文