专栏名称: BioArt
BioArt致力于分享生命科学领域科研学术背后鲜为人知的故事,及时报道和评论生命科学领域有料的动态,BioArt也是一个生命科学领域“百花齐放,百家争鸣”的舞台,循“自由之思想”与“独立之精神”为往圣继绝学。
目录
相关文章推荐
BioArt  ·  Cell | ... ·  昨天  
生物学霸  ·  已考察,地方高校将获千万级项目 ·  6 天前  
生物学霸  ·  67 亿,医科大学,新校区启用 ·  6 天前  
生物制品圈  ·  近视中靶向MicroRNA的研究:当前见解 ·  1 周前  
51好读  ›  专栏  ›  BioArt

​Genome Bio丨邵振/柳欣/詹丽杏团队开发多样本比较模型集zMAP解析红细胞分化和肝癌蛋白质组异质性

BioArt  · 公众号  · 生物  · 2024-10-16 08:40

正文


TMT和 iTRAQ等重同位素标记技术已广泛用于蛋白质组定量分析,为研究组织发育和疾病进程中的蛋白质表达变化提供了基础。现有的蛋白质组差异分析工具主要面向两个或两组样本之间比较,能做多样本比较的工具还不多。尤其是这些平台生成的蛋白质组数据往往包含强烈的批次效应,导致能够整合多个质谱实验批次数据开展定量比较分析的工具更是匮乏,局限了它们在大规模生物样本分析中的应用。


中国科学院上海营养与健康所邵振课题组、詹丽杏课题组和分子细胞科学卓越创新中心柳欣课题组合作在Genome Biology发表了研究:zMAP toolset: model‑based analysis of large‑scale proteomic data via a variance stabilizing z‑transformation。针对该瓶颈,研究者开发了zMAP和reverse-zMAP两个新计算模型,并基于它们搭建了一个多功能的蛋白质组数据分析平台(http://bioinfo.cemps.ac.cn/shaolab/zMAP),面向基于不同实验设计的多批次多样本数据开展统计比较和下游整合分析 (图1)

图1:蛋白质组数据分析平台zMAP的核心架构。

样本数较少时,往往会在同一质谱实验批次并行测量,必要时通过增加批次生成多次生物学重复;样本数较多时,如癌症蛋白质组研究往往涵盖上百例病人肿瘤和瘤旁对照组织,通常会在每个批次引入一个内参样本,由被比较样本等量混合而成。对此,zMAP和reverse-zMAP模型使用不同的分步回归流程构建均值-方差曲线来建模蛋白质信号中技术误差的影响,识别样本间差异表达的高变化蛋白质 (hypervariable proteins);同时,提出基于均值-方差曲线对蛋白质信号强度做方差平稳z变换,得到一个表征蛋白质相对表达变化的z统计值 。相比传统z-score变换,该统计值保留了有生物学意义的信号变化,并在不同批次样本之间表现出更优越的可比性,能够更好地用于开展主成分分析、样本聚类、蛋白质共表达模块/网络构建、跨组学数据整合等下游定量分析。

研究人员应用zMAP分析了一个已发表的红细胞分化蛋白质组数据集,包含4种细胞类型(成年阶段造血干祖细胞A0及体外分化5天后的原红细胞A5;胚胎阶段造血干祖细胞F0及分化5天后的原红细胞F5)和5次4通道iTRAQ 实验生成的5组生物学重复。zMAP识别了2290个显著高变化蛋白质,并基于z统计值对它们的表达模式聚类,发现很多仅在胚胎红细胞分化过程中上调的蛋白质。研究人员从中选择了S100A8、S100A9、CHI3L1和PTEN,验证了这些基因在相应分化过程中发挥了不可或缺的作用。

研究人员应用reverse-zMAP分析了一个包含159例原发肝癌患者肿瘤和瘤旁正常对照组织的公开TMT蛋白质组数据集,鉴定出3097个高变蛋白质。基于它们z统计值矩阵的主成分分析可以将两类样本清楚分开。结合z统计值和病人生存数据的Cox比例风险回归分析鉴定了大量预后相关蛋白质。它们中69.6%与第一主成分 (PC1) 显著相关,即在肿瘤和正常对照组织之间差异表达,其中很多如NPC1和UBE2C可作为肝癌进展分子标志物。研究人员基于PC1得分对肿瘤样本进行层次聚类,将它们分为三个亚组,发现该分型能够比常用的TNM和BCLC分期更好地解释病人预后差异;另一方面,基于z统计值的基因集变异分析 (GSVA) 指出,PC1得分较高的癌旁对照肝组织样本表现出肝代谢通路下调和免疫相关通路上调这一特殊状态,可能为肝癌发生“炎癌转换”过程蛋白质组的转变模式提供有价值线索。上述两方面发现表明这两类病人组织样本沿PC1分布的异质性均具有可观的生物学意义。

此外,研究人员还整合z统计值和肿瘤体细胞突变数据开展了蛋白质表达数量性状位点分析(pQTL)。5个高频突变基因中,携带TSC2突变的肿瘤样本PC1得分较高,并且患者预后较差,其肿瘤中TSC2蛋白质表达显著降低。从pQTL 结果,发现TSC2突变下调的均为对病人生存有利的蛋白质,而上调的均为对病人生存不利的蛋白质。最后,研究人员验证了NPC1和UBE2C对肝癌细胞增殖和侵袭的促进作用以及TSC2的抑癌作用。此外,还基于高变化蛋白质在所有肿瘤样本的z统计值矩阵,发展了蛋白质共表达网络构建方法,发现所得网络表现出强烈的模块化结构。

为更全面地探索reverse-zMAP在肿瘤蛋白质组定量解析中的应用,将其应用在218例儿童脑瘤TMT蛋白质数据,发现基于高变蛋白质z统计值的聚类可以将病人分为预后显著不同的七个分子亚型,而绝大多数高变蛋白质在不同亚型之间表现出显著的差异表达模式。此外,通过101例早期肝癌肿瘤蛋白质组数据,还验证了它用于分析非标记(label-free)蛋白质组数据的原理可行性。

综上所述,zMAP平台可用于对常用实验设计下单一或多个质谱实验批次产生的多样本蛋白质组数据开展统计比较,并基于其输出的z统计值和高变化蛋白质,开展各种下游功能解读和跨组学整合分析。在此基础上,如何进一步直接针对肿瘤间蛋白质组异质性开展统计建模和解读,以及如何将这一系列分析迁移到各种非标记技术生成的蛋白质组数据并对参数估计流程作相应调整,研究人员正在继续发展适用的理论框架。

以上研究工作由中国科学院上海营养与健康所邵振课题组、詹丽杏课题组和分子细胞科学卓越创新中心柳欣课题组合作完成。博士后桂秀琪和研究生黄静、阮林杰、吴燕君、郭烜为论文共同第一作者,邵振研究员、涂世奇副研究员、柳欣研究员和詹丽杏研究员为共同通讯作者。上海营养与健康所大数据中心和上海药物所周虎课题组为蛋白质组原始数据下载和预处理提供了大力帮助。研究使用的所有组学数据均为已公开发表数据。

论文链接:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-024-03382-9


制版人:十一


BioART战略合作伙伴

(*排名不分先后)

BioART友情合作伙伴
(*排名不分先后)

转载须知


【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。





BioArt

Med

Plants

人才招聘

会议资讯



近期直播推荐