本期撰文:谭灏文近日Science杂志刊登了一篇人类基因变异与表型的关联性研究,题目为Deconstructingthesourcesofgenotype-phenotypeassociationsinhumans的综述,总结了过去数十年来对人类基因型与表型的关联性探索的策略进展与阶段性重要成果,并讨论了直接与间接遗传效应对关联性研究的干扰,进一步讨论了由于人口结构混杂性带来的关联性研究顶层设计的挑战和机遇,总结了新的思路:通过分析近亲家系基因型与表型的关系研究可能是一个更高效的方案。
基因的发现
早在年,人们就通过基因组标记连锁分析(STR)定位,在患病家庭成员中,发现了X连锁吞噬障碍慢性粒细胞疾病(CYBB)。随后该方法陆续发现囊性纤维化(CFTR),亨廷顿舞蹈病(HTT),以及乳腺癌的基因(BRCA1,BRCA2)。这些都是典型的外显率很高的单基因遗传病,同时期该方法用于2型糖尿病这类复杂遗传病,则未能定位到致病基因。很快,我们迎来了新一波的高通量技术,基因芯片(SNParrays),带来了高效的全基因组方法,从而引领出全基因组关联分析这一策略(GWAS),并率先在年发现了黄斑变性的致病基因(CFH)。GWAS不需要收集完整的家系,只需要设定好阳性组与对照组,既可用通过计算OR值,来定位基因。最早的GWAS研究,比如CFH的发现,就是通过96个case组样本,与50个ctrl组样本,即实现,这个技术更新是划时代的,因为不需要依赖家系,对于许多复杂的性状,GWAS改变了基因研究的局面以及我们对遗传结构的理解,对于常见疾病的研究可以打开一条新的通路(图1)。图1:自从年第一个GWAS队列结束,常见疾病的基因发现出现指数上涨。图片来源Claussnitzer,genetics.Nature,–()GWAS的本质是发现最影响某一个性状(trait)的SNP,GWAS并不需要知道影响性状的变异本身(比如对某个疾病,并不需要知道阳性个体的关键的致病变异是SNV,INDEL还是CNV,SV)。GWAS是通过检测在群体中等位基因频率高于5%(早期基因芯片,近代基因芯片设计越来越大,可以达到1%的MAF),假设阳性组中,有部分个体是由于共同的基因变异导致同样的性状,由于常见病的致病变异通常在群体中是能传递下来的,因此在该基因附近的区域(haplotypeblock)是缺乏重组事件的(LowRe