Nature论文快讯肺癌基因组学的未来从

第一作者:CarlosMartínez-Ruiz,JamesR.M.Black,ClarePuttick,MarkS.Hill

通讯作者:CharlesSwantonorNicholasMcGranahan

第一单位:CancerResearchUKLungCancerCentreofExcellence,UniversityCollegeLondonCancerInstitute,London,UK

全文一句话速览

本研究利用多区域测序数据,来研究非小细胞肺癌(NSCLC)进化中多种转录组特征的影响,及其与基因组和表型多样性的相互作用,发现转录组异质性与免疫逃逸和治疗耐药有关。

研究背景

了解癌细胞间变异的原因,对于理解肿瘤演化至关重要。

近期研究强调,这种变异的很大一部分来自于转录组,与基因组变异有关或独立于其之上。

全文亮点

本研究利用机器学习和Python等计算机技术,利用多区域测序数据,来研究非小细胞肺癌(NSCLC)进化中多种转录组特征的影响,及其与基因组和表型多样性的相互作用。

结果表明,肺癌进化的转录组异质性与免疫逃逸和治疗耐药有关。

图文解析

图1:TRACERx队列中的表达多样性。

a,转录组多样性的主成分(PC)与基因组(黑色标签)和临床(蓝色标签)变量的关系。显示了在LUADs(来自个肿瘤的个区域)和LUSCs(来自个肿瘤的个区域)中,至少解释了总方差30%的顶部PC,以及它们的异质性中位数比率(PC活动的肿瘤内异质性除以PC活动的肿瘤间异质性)。每个方框周围的边框颜色表示每个协变量与PC之间的关联方向。共测试了39个变量(方法)。使用纯度作为固定协变量和肿瘤作为随机变量的混合效应线性模型确定显著性。仅显示在FDR校正后至少与一个PC显著(P0.05)的特征。*LUAD中的PC1与与增殖相关的标志基因集的表达强烈负相关(扩展数据图1f,方法)。GD,基因组倍增;TMB,肿瘤突变负荷;wGII,加权基因组不稳定指数。

b,I-TED,由同一肿瘤中的给定区域与其他每个区域配对的平均归一化基因表达相关距离计算,按组织学显示。

c,I-TED的方差比例,使用个至少具有2个原发性肿瘤区域的肿瘤的线性模型解释,以及纯度和基因组不稳定性估计值。仅包含仅由单个肿瘤代表的组织学类型,以确保有足够大的样本量来估计组织学影响。**P=0.,***P=5.15×10?10。

d,ASCAT推导的肿瘤纯度和肿瘤转录本分数的RNA估计值。每个点代表一个肿瘤区域。使用ASCAT50的修改版本来估计混合测序样本中肿瘤和非肿瘤细胞的比例。

e、通过分别按中位数基因表达值的三分位和基因表达值异质性的三分位来推断癌基因和非癌基因截短体突变的正选择和负选择的dN/dS比值。左图显示了基因表达值的三分位,右图显示了基因表达值异质性的三分位。点表示估计的dN/dS比值,误差条表示使用R软件包dNdScv中的genesetdnds函数计算的95%置信区间。如果95%置信区间不重叠1,则认为dN/dS比值估计是显著的。对于第3、2和1三分位,表达水平包含76、24和9个癌基因以及4,、5,和5,个非癌基因。对于第3、2和1三分位,表达异质性包含54、24和31个癌基因以及4,、5,和5,个非癌基因。基于在手术切除时收集的具有多个样本的肿瘤中收集的肿瘤样本的总数(n=个肿瘤的个区域)来计算中位数表达水平和表达异质性。

图2:NSCLC中的ASE。

a,示意图展示了双等位基因表达、CN依赖ASE(CN-depASE)和CN独立ASE(CN-indASE)的概念。b,评估性基因(包含表达的SNP)中受CN依赖ASE和CN独立ASE影响的比例,在肿瘤和正常组织样本中。LUAD,来自个肿瘤的个区域;LUSC,来自88个肿瘤的个区域;其他亚型,来自38个肿瘤的个区域;正常,与肿瘤毗邻的正常肺组织,n=95。c,点表示在同一基因中同时检测到体细胞点突变或ASM(对于同时具有RRBS和RNA-seq的样本)时,CN独立ASE的几率比估计值,按照变异类型分类。条形图表示95%置信区间。CN独立ASE与突变之间和CN独立ASE与ASM之间的几率比基于来自个肿瘤的个原发性肿瘤区域和31个肿瘤的96个肿瘤区域,分别计算。d,LUAD中CN独立ASE可评估基因比例与相邻CpGs的差异性低甲基化簇与所有差异性甲基化基因组位置的比率之间的关系。使用以肿瘤为随机变量的线性混合效应模型计算P值。e.线性混合效应模型显示了候选表观遗传修饰基因的驱动突变22(在超过五个肿瘤中突变)和肿瘤突变负担对CN独立ASE的影响。在多变量模型中与增加CN独立ASE独立相关的因素为蓝色。*P0.05,**P0.01,***P0.。f.FAT1中发生的基因组-转录组镜像亚克隆等位不平衡的示例在CRUK内发生。绘制了FAT1中每个SNP的DNA和RNAB等位频率(BAF),并根据在肿瘤中采样的每个区域中每个等位的参考和变异状态进行着色。在这种情况下,有证据表明在两个区域中存在CN依赖ASE,在一个区域中存在CN独立ASE。这些事件有利于不同的亲代等位基因的过表达,并发生在系统发育树的不同分支上;显示了简化版本。MRCA表示最近的共同祖先。

通讯作者简介

JamesZou,斯坦福大学计算机科学系和生物医学数据科学研究所的助理教授,研究领域包括机器学习、计算生物学和人工智能。研究旨在开发算法和方法来应对临床、生物医学和社会科学中的数据科学挑战,并帮助实现个性化医疗。RyanCopping,斯坦福大学医学院和健康研究所的博士后研究员,研究方向包括医学数据科学、人工智能和生物信息学。研究旨在利用大规模医疗数据来改进临床试验的设计和推动个体化医学。


转载请注明:http://www.bjgongshangzhuce.com/jyxc/9797.html


当前时间: