可变剪切的失调与许多人类疾病密切相关,了解转录物剪切的遗传变异对解析癌症的分子机制至关重要。
因此,可变剪切也是癌症研究的热点方向。生信人早在四五年前就开始推出可变剪切相关的分析思路及方法。小编今天再和大家分享一篇
23
年
11
月
发表在
GASTROENTEROLOGY(IF:29.4/Q1)
杂志上关于
可变剪切的文章。该文章全面分析了剪切
数量性状位点
(sQTLs)
在癌症中的功能,并重点
分析了
其在结直肠癌
(CRC)
中的独特作用
机制。
时隔几年可变剪切仍能发
30
分,可见可变剪切热度不减。长话短说,小编今天就带大家一睹为快。
Genetic control of alternative splicing and its distinct role in colorectal cancer mechanisms
可变
剪
切
的遗传控制及其在结直肠癌中的独特作用
机制
一.文章摘要
研究对
TCGA
泛癌样本
进行了全面的
sQTL
分析,识别出
33
种癌症中控制信使
RNA
剪切的遗传变异,并对
154
例结直肠癌
(CRC)
样本进行了
独立验证。
此外,研究也纳入了大规模、多中心、多种族的病例对照样本,对识别的关键
sQTIL
与
CRC
风险的相关性
进行分析。最后研究也进行了一系列体外和体内生物学实验,分析并验证候选
sQTL
和靶基因的潜在机制。
最终研究揭示了
sQTL
的分子特征及
其在肿瘤易感性中的独特作用。
二.文章的主要内容及结果
1.33种癌症剪切数量性状位点图谱的功能特征
研究首先在泛癌中分析了sQTL的功能特征。
研究
使用
TCGA
数据,
识别了
33
种癌症的
9026
例肿瘤样本中的
168,694
个
可变剪切
(
AS)
事件和
4,599,598
个
sQTL(
图
1A)
。
研究观察到随着样本量的增加,剪切事件和
sQTL
的数量也
稳步增加
(
图
1B)
,这意味着
新的剪切事件和
sQTL
仍有待发现。研究也观察到癌症特异性
的
sQTL
-AS
对占总对
数
的
51.86%
,这意味着它们在不同癌症中具有独特的调节作用
(
图
1C)
。
研究通过位置富集分析也观察到
sQTL
在外显子区域显著富集
(
图
1D)
。
研究也注释了
sQTL
在不同调控层面的分子特征,结果发现在启动子和增强子
等调控区域
sQTL
显著富集
(
图
1E)
。在本分析中包含的所有
研究分析了
59
个转录因子
(
TF)
,
观察到
NRF1
、
MYC
和
MNT
优先结合
sQTL(
图
1F)
。
研究也观察到
sQTL
在
RNA
结合蛋白
(RBPs)
的结合位点富集
(
图
1G)
。此外,
研究也发现
只有
16.8%
的
sQTL
影响整体基因表达
(
图
1I)
,表明基因表达和剪切事件的独立调控。此外,多种癌症中
表达数量性状位点
(
eQTL)
和
sQTL
在
GWAS
信号中
都便显出
了过量的低
P
值
(
图
1I)
。
研究也发现
在检测的
13
个性状中,
sQTL
和
e
QTL
分别解释了约
0.37%-9.47%
和
1.01%-8.78%
的遗传力
(
图
1J)
。
图
1 33
种人类癌症类型
sQTL
的识别和功能刻画
2.sQTL靶向基因增强了对生物学过程的解释
研究接着对sQTL的靶基因进行了分析刻画。
研究识别了
sQTL
的靶基因
(
sGenes
)
,并观察到其
在多种癌症相关通路
(
图
2A)
和突变基因
(
图
2B)
中富集。
sGenes
还
被发现具有大量的扩增和缺失负荷
(
图
2C)
。
此外,研究也
观察到
sGene
的表达与
CD8+ T
细胞和调节性
T
细胞等免疫细胞的浸润密切相关
(
图
2D)
。
研究也基于药物敏感性基因组学数据识别
了
29,924
对
sGene-drug(
图
2E)
。
图2 sGenes的特征分析
3.中国结直肠癌患者剪切数量性状位点分析
研究接着对结肠癌的sQTL进行了重点分析。
研究收集了来自中国人群的
154
个结直肠肿瘤和配对正常组织,并构建了首个
sQTL
图谱
(
图
3A)
。研究识别出
11
个优先结合到含有
sQTL
区域的
RBPs
,其中包括几个剪切
因子
(
图
3B)
。
研究也观察到肿瘤组织中多数
sQTLs
与
eQTLs
具有显著差异
(
图
3C)
,
且
eQTLs
与影响同一基因的
sQTLs
之间的距离较大
(
图
3D)
。此外,
这两类
QTL
也
在
CRC
的
GWAS
中
表现出
了过量的低
P
值
(
图
3E)
。
研究也发现了
32
个在肿瘤特异性
sQTL
中富集
更强的
RBPs
(
图
3F)
,这些
sQTL
也
在
CRC
中显著上调
(
图
3G)
。
此外,研究还观察到与正常特异性
sQTL
相比,亚洲人群中
CRC
相关变异富含
CRC
特异性
sQTL(
图
3I)
。
研究也观察到
使用
eQTL
或
sQTL PRS
的风险分层
更好
(
图
3J)
。
图3 中国结直肠癌患者sQTL谱的验证
4.剪切数量性状位点变异rs61746794与多人群结直肠癌风险显著相关
研究接着分析了与CRC风险显著相关的sQTL。
文章首先将
sQTL(
图
4A)
与
CRC
风险的关联进行整合
,结果发现了与结直肠癌风险最显著相关的位点
rs61746794(
表
1
和图
4B)
。研究接着将
rs61746794
在来自北京的
1524
例和
1522
例对照以及来自前列腺、肺癌、结直肠癌和卵巢癌筛查试验的
1233
例和
7398
例对照中进行进一步的
I
期复制,并发现
T
等位基因与
CRC
风险增加显著相关。在复制
II
阶段,研究也在来自武汉的
4500
例病例和
8500
例对照以及来自英国生物银行的
5246
例病例和
31476
例对照中验证了这种显著相关性。最后,研究将发现和复制阶段的结果结合起来,发现
rs61746794[TT]
基因型仍与亚洲和欧洲人群中
CRC
风险增加相关
(
表
1)
。
表1 个体单核苷酸多态性与三期及联合样本结直肠癌风险的相关性分析
5.剪切数量性状位点变异rs61746794 T等位基因促进PRPF8介导的PRMT7外显子16剪切
研究接着对rs61746794 T等位基因相关外显子进行了分析。
研究
根据
Ensembl
数据库
(GRCh37)
的注释和
TCGA
SpliceSeq
的分析结果,观察到
人类
PRMT7
基因模型共包含
20
个外显子,主要可以拼接成
28
个转录本。其中有
6
个转录本参与
AA_exon 16
剪切
事件,分别记为
PRMT7-V1
至
PRMT7-V6(
图
4C)
。
研究接着发现
rs61746794
的
T
等位基因与
TCGA
和
该研究
数据中
PRMT7
外显子
16
的替代受体位点密切相关
(
图
4D
和
E)
。
研究也发现
当
rs61746794-C
等位基因转变为
T
等位基因时,
PRMT7
外显子
16
受体位点产生了更强的信号
(
图
4F
和
G)
。
图4 rs61746794可能改变CRC中PRMT7外显子16剪切的功能性sQTL
接着研究试图分析
rs61746794
等位基因特异性活性的潜在机制。
根据
ENCORI
数据库
结果研究发现
PRPF8
特异性结合
PRMT7-V1
和
PRMT7-V2
中含有
rs61746794
的区域
(
图
5A)
。此外,
研究
使用
RBP
免疫沉淀和
RNA
拉下实验验证了
PRPF8
与
rs61746794-C
相比,主要结合在
rs61746794-T
区域
(
图
5B
和
C)
。多个数据集
中也都观察到
与正常组织相比,
PRPF8
在肿瘤组织中显著过表达
(
图
5D)
。
研究也在
TCGA
和自己的数据中观察到,
PRPF8
的表达与
CRC
中外显子
16.1
的包含水平呈负相关
(
图
5E)
。此外,
PRPF8
的表达水平与
PRMT7- v1
的表达呈负相关,而与
PRMT7- v2
的表达在群体
(
图
5F)
和细胞系中呈正相关。
研究也观察到
PRPF8
的敲低
会
导致
PRMT7
外显子
16
的
剪切
信号显著减弱
(
图
5G
和
H)
。
图5 PRPF8优先结合rs61746794-T等位基因,促进致癌PRMT7剪切
6.PRMT7亚型通过催化H4R3和H3R2甲基化增加结直肠癌的风险
文章最后分析了PRMT7亚型增加CRC风险的机制。
研究发现
MT7
作为一个潜在的致癌基因
能够
促进
CRC
的进展
(
图
6A
和
B)
,与正常组织相比
PRMT7_AA_16.1
的
剪切百分比在肿瘤组织中也
显著下调
(
图
6C)
,这表明外显子
16.1
的
剪切
可能与
CRC
的发展有关。
因此,研究通过实验验证发现
与
PRMT7- v1
或对照载体相比,
PRMT7-V2
过表达
会
显著增强细胞增殖和集落形成能力
(
图
6D
和
E)
。
研究也观察到
在体内过表达
PRMT7-V2
的异种移植物的生长明显高于
PRMT7- v1
和对照
(
图
6F)
。
此外,
与
PRMT7- v1
过表达的细胞相比,
研究
在
PRMT7- v2
过表达的细胞中
识别
了
72
个显著差异的甲基化肽,代表
49
种独特的蛋白质,
其中包括
组蛋白
H3(R9)
和
H4(R20)
肽的甲基化信号
(
图
6G
和
H)
。
研究通过实验检测到
已知的
PRMT7
底物,如
DDX23
和
CALM3
,
并观察到
PRMT7-V2
过表达细胞中
H3R2me2s
和
H4R3me2s
的修饰均有所增加,但
H3
和
H4
未见明显变化
(
图
6I)
。为了进一步确定
prmt7
依赖性组蛋白甲基化的转录调控作用,
研究
进行了
RNA
测序,结果显示经典致癌信号通路中基因的转录发生了广泛的变化,包括
YAP
、
AKT
和
KRAS
通路
(
图
6J
和
K)
。
图6 PRMT7亚型通过激活组蛋白精氨酸甲基化促进结直肠癌细胞增殖