研究团队用-年的16个英国面包小麦历史品种作为亲本,创建了包含个RIL的多亲本重组自交系群体(NAD群体),并用外显子+启动子捕获测序技术和低覆盖度的全基因组测序技术分别对16个亲本和个RIL进行基因型测序,共获得1.1M的高质量SNP位点。对亲本的遗传多样性分析发现育种基因池的单倍型多样性很有限,83%的基因集(genescluster)单倍型不超过3个。对个RIL家系的47个农艺性状的2年表型数据进行GWAS关联分析发现个显著关联位点,主要集中在42个遗传单位中,其中有大约一半是已知基因,很多属于多效位点,这意味着对于一个性状的选择可能会产生一些不好的连锁效应,例如产量和品质之间的负相关性(也就是育种常说的“高产不优质,优质不高产”),这种负相关可以通过强烈的靶向育种打破。
过去70年,小麦育种的遗传改良主要是通过有限的单倍型间的精细重组组合多个微效多基因,再结合少量外缘优异位点(其它物种的大片段渗入是抗病性改良的常用资源)的使用获得遗传增益。作者预测未来表型的改良将需要在多个位点进行选择。育种家可以选择在现有的变异池中继续进行选择同时结合外缘优异遗传位点的引入,或者直接扩大基因池中可用的单倍型多样性来提高育种潜力。
1.群体创制与单倍型多样性从大约70年间,英国的94个历史品种进行个DArT和61个SSR标记测序,根据遗传多样性选择16个品种作为亲本,群体创制过程如图1a。对亲本Holdfast进行全基因组测序,测序深度15.8╳,其它15个亲本进行基因和启动子区的靶向测序,测序深度22.94╳,个RIL进行基因及启动子捕获测序,测序深度0.34╳。数据过滤之后得到1.13MSNP,91%不直接影响蛋白序列。单倍型分析发现在亲本之间单倍型多样性十分有限,52%的SNP仅有两种单倍型,83%的SNP单倍型不超过3个,95%的SNP单倍型不超过4个(图1b)。图1.NAD群体设计及单倍型多样性a)个RIL的系谱;b)SNP在16个亲本间的单倍型多样性;c)1A染色体在16个亲本间的单倍型模式;d)NDMRIL基因组来自于各个亲本的贡献全长;e)5个RIL的1A染色体单倍型组成。
2.关联分析对46个性状(包括农艺,籽粒,产量,抗病等)进行了两年的重复试验,共获得73个测量数据,不同性状数据之间存在广泛的相关性,并且几乎所有的性状都表现超亲分离现象。在没有选择的情况下,重组更多的会打破已有的有利等位基因组合,而不是创造新的有利等位基因组合。“聚合多个基因时,基因数目越多,聚合在一起的概率越小。这也说明了这些亲本已经聚合的有利等位基因个数已经到达了一个水平,再想要继续聚合更多的基因所需的群体规模和工作量会非常巨大”。GWAS分析共鉴定到个QTL,其中很多位点是重合的,可以分到42个遗传位点,区间大小多在9.2Mb(图3a)。其中有21个带有大效应值的遗传位点对应已报到的重要基因,包括矮秆基因Rht24,粒重基因TaGW2,春化基因VRN,早花等位基因PPD-D1等(图3c)。很多QTL是多效位点,这与表型之间存在广泛的相关性一致(图3d)。
图2.基因型-表型关联
3.基因组预测与育种改良潜力在NDM中,用55,个SNP进行表型预测,以LASSO模型探索遗传改良潜力。基于Founder之间的单倍型组合以及遗传图的连锁关系建立了一个40倍大小的模拟MAGIC群体,包含个RIL。用LASSO模型预测模拟群体的表型。模拟群体的表型分布与真实群体(个RIL)基本一致(图3a)。表型预测的理论最大/最小值与LASSO模型的复杂程度相关,也就是模型中用到的非零SNP系数的个数(图3b)。但是对于多基因性状,在模拟群体中没有一个RIL达到理论值得极限,模拟群体的最大/最小表型预测值只与真实群体存在-0.5和+0.68的标准差。这说明数百个位点需要被选择多代才可以产生任意大的表型变化,几十年的育种可以获得遗传增益。
图3.表型变化的预测潜力
4.产量与蛋白含量之间的平衡Founder的产量和蛋白含量之间存在明显的负相关,相关系数-0.94。在个RILs中GY-GPC相关系数为-0.77,说明产量-蛋白之间存在一种拮抗多效性(图4a)。为了探索通过重组这种连锁是否可以被打破,我们结合蛋白浓度+产量定义了一个新的表型蛋白产量偏差(PYD,protein-yielddeviation),PYD为正的家系,产量和蛋白负相关性减弱,在将来这种连锁性有可能被打破(图4b),但是需要强烈的靶向育种来实现,例如通过改良N肥利用效率培育新品种有这种潜力。另外,芒的有无与PYD显著相关,有芒时PYD显著增加,在RIL中,SNP-5A:与芒的存在显著关联,也可作为一个参考。
图4.蛋白含量与产量的平衡
原文链接: