NatureReviewsGenetic

本节为NatureReviewsGenetics

儿科基因组学:诊断儿童罕见病第四节,

前面部分请查阅

NatureReviewsGenetics

儿科基因组学:诊断儿童罕见病(一)

NatureReviewsGenetics

儿科基因组学:诊断儿童罕见病(二)

NatureReviewsGenetics

儿科基因组学:诊断儿童罕见病(三)

变异识别和注释

变异识别和注释是一个高度复杂的过程,即便是同一个人的全基因组测序数据使用相同的分析流程也不会得到%重复的结果。变异识别首先是通过比较参考基因组上的DNA序列来识别待分析样本中存在哪些变异。识别变异的敏感性依赖于测序数据质量、参考基因以及所使用的算法。低质量和低覆盖度的数据可能会导致在分析过程中遗失重要的变异位点。变异识别,特别是针对微小的插入缺失变异,即便这一变异真实存在也可能会有由于这一变异位于重复序列中而难以被正确的识别,从而导致错误的诊断结果。变异识别的结果通常以标准的VCF(VariantCallFormat)文件格式保存,并可以用于进一步的临床分析,以便于整合更多的注释信息。一些注释信息对于在临床解释变异尤为重要,特别是次等位基因频率(MAF)和变异功能预测。所有的注释中,除了次等位基因频率外,大多数的注释信息会根据所使用的预测软件的不同而有所变化。因此,虽然来源相同的VCF文件也可能最终展现出不同的分析结果。

变异筛选

在分析过程中,具体哪些变异将进入 诊断分析评估或是被排除在外,很大程度上依赖于分析中所使用的数据库资源及这些资源更新的时间。如果变异位点满足以下这些情况将会被过滤掉,包括:无法预测结果的变异(游侠补充如同义突变、内含子突变、启动子突变等);不可能导致罕见遗传疾病的人群中高频率突变;或是变异不符合疾病的已知遗传模式(图3)。

(图3,安全、有效的开展儿科基因组相关的诊断服务需要不无细致的优化来自临床、生物信息学和各个领域的专业融合。每个变异过滤的过程都需要细致的评估,因为每个步骤都有可能将疾病相关的变异不经意的排除,因此严格的过滤流程可以保证在减少变异数量的同时,将有效的、精简的数据提供给专家来进行 的评估。如果一个变异的次等位基因频率大于1%或者甚至大于0.1%,这个位点将不会被进一步的考虑。需要注意的是一个疾病相关的变异可能会由于以下一些原因被排除:分析时所使用基因转录本的不正确;在家系分析中使用了错误的遗传模式(如轻微的表型被认为是正常);测序或序列分析过程中没有能够捕获到疾病相关的变异等(如在脆性X综合征中三核甘酸CGG重复)。临床上对患儿的评估发生在诊断初期和后期。在初期,通过获取其详细的表型来判断是否可能是基因变异导致,并选择合适的检测方法。在分析的 流程中,临床专家可根据患儿的测序及表型数据评估所筛选的变异的准确性,并明确是否可以进一步用于未来患儿的临床干预方案及其亲属的检测,或用于辅助生殖和产前诊断。针对一些疑难案例,罕见变异的确定通常是需要多学科领域的临床专家和临床科学家一起来进行讨论后才能够确定(见图4),点击图片可放大)

如果采用家系分析的方法,必须注意在对父母的表型评估的过程中,确认他们没有与患儿的疾病相关的轻微的临床症状,否则会对疾病的遗传模式做出错误的判断,从而导致分析结果的混淆。过滤那些非同义突变需要非常精确的预测方法,比如EnsemblVEP或SNPeff等软件可以实现这些功能。但是,目前这些预测方法并无法真正反映出变异导致的生物学后果。此外,基因组上的同一个变异可能会有由于基因可变剪切机制的存在而导致预测结果不同,因此导致不同诊断实验室出现预测结果差异的一个原因之一是缺乏统一简单的方法来确认大多数基因的某个转录本和疾病的相关性。辨别常见的变异需要基于类似ExAC和gnomAD这样有大规模人群统计数据的资源。目前,这些数据库包含来自,个全外显子和15个全基因组的人群研究数据,然而这些数据依然存在部分种族的人群数据覆盖不全面的问题。相比于成人的疾病,导致严重的儿童遗传疾病的往往是基因的变异而且是非常罕见的,生活习惯及环境因素都不太可能是导致这类在婴幼儿期出现的严重的疾病的原因。因此,在分析过程中,一个数据库中是否有不同种族数据测序的类型和数据量对于遗传变异的筛选有重要的影响,特别要注意这些数据库中欧洲人的数据占比很高。

(图4,基于多学科领域团队开展的表型评级和注释过程。两个互补的方法(临床和统计)可用于表型评级。a

临床分析方法:通过变异对蛋白功能的影响、人群频率和遗传评估后,筛选得到的变异需要进一步参考患儿的临床表型。这一过程需要一个多学科领域团队的协作开展,通过评估患者当前的健康状况,家族史,既往史以及各项体检的结果(生化检测和影像学检查),以及综合疾病候选基因相关的临床特征和文献数据(图4b)。基于实验室建议的分子诊断,临床可能会需要补充新的数据(如家族史的研究,或针对患儿的重新或进一步的临床检查)用于 的决策,建立明确的遗传诊断,或是拒绝无法解释患者临床特征和家族遗传模式的分子诊断结果。在一定比例的案例中,会无法对患者做出明确的诊断结果。b

统计学分析方法:通过表型的匹配程度进行分析,这一分析要求分类地、基于数量和/或图像的表型信息出现在患儿和一定数量的亲属中,且他们都有拥有相同的疾病变异基因。通过这些数据将允许我们采用统计学的方法,比较不同的疾病模型,量化表型匹配程度。这类分析受样本数量的影响,罕见和极罕见遗传病患者数量越多就会越容易找到致病基因。BWt,体重;DQ:发育商;HPO:人类表型标准用语联盟;Ht,身高;OFC,枕额周;Wt,体重,点击图片可放大)

译者介绍

贾佳,女,博士,副研究员,医院生物医学信息中心课题组长,上海市生物信息技术研究中心生命科学数据中心主任,上海市“浦江人才”,中华医学会儿科学分会罕见病学组青年委员。主要研究方向为遗传病及肿瘤生物信息学方法研发及转化应用,生物医药信息数据资源开发和整合技术的研究。目前作为主要负责人承担和参与国家、国家自然科学基金、上海市研发公共服务平台建设专项课题、上海市科委等10项国家和地方重大科研项目,主持课题总经费万。年以来在《NatureReviewsDrugDiscovery》等SCI发表学术论文24篇。近年来主要参与智力障碍、发育迟缓、遗传代谢病诊断方面的临床基因诊断和咨询

赞赏

长按







































白癜风药膏有哪几种
白癜风是什么引起的



转载请注明:http://www.bjgongshangzhuce.com/jywh/2319.html


当前时间: