背景
1植物株型结构被定义为植物的三维构成,植物的株型与植物的适应性、产量和质量息息相关,绿色革命的成功与株型的改变息息相关。
2棉花是世界范围内最重要的纤维作物之一。陆地棉是四倍体的棉花品种,产量占全球棉花产量的95%。棉花的株型是一个重要的农艺性状,与棉花的机械收割、产量和密植有关。它代表了包含株高(PH)、果枝长度(FBL)、果枝角度(FBA)、第一果枝位置(FFBP)、第一果枝位置高度(HFFBP)、果枝数量(FB)、茎节长度(SNP)和果枝节间长度(FBIL)等。现代化的棉花收割使短而紧凑的棉花品种越来越重要。
3植物的株型主要受遗传因素控制,PH,FBL,FBA,FFBP和HFFBP是最重要的,因为它们反映了棉花植物的空间构象,这与株型的紧密性密切相关。
方法
份有代表性的棉花材料,其中有份材料来自中国,24份来自与美国,分为5个组,分别为YRR(),YZRR(51),NIR(98),NSER(20)和US(20)。在~年种植于安阳和石河子,每个地区三个重复。
2利用简化基因组技术,使用HaeIII和RsaI进行酶切,利用Hiseq进行测序,每个样品对酶切片段测序5.39X。分析软件:BWA+GATK+samtools
3遗传多样性分析:Power-Marker,vcftools,admixture
4GWAS分析:GAPIT+LDheatMap
5利用高而不紧密的棉花品种和密而紧凑的棉花进行qRT-PCR来确定差异表达.
结果
1对于3年2点的5个主要的株型性状进行调查,虽然中国材料之间的遗传多样性本身较低,但是表型的多样性在这些性状中均反映了较高的比例。例如,PH范围从28.23~98.89cM,平均值为62.45。基于ANOVA分析,基因型、环境和基因型与环境的互作对所有的性状具有较高的相关性。在PH,FBL,FFBP和HFFBP之间观察到显着的正相关,而FBA与PH,FFBP或HFFBP间无显着相关性。
2在个棉花中,共开发获得了1.4M的SNP数据,过滤掉低完整度和低次要等位基因频率(Miss0.2MAF0.05)的SNP后还剩93K的SNP。在A亚基因组上开发了61K,在D亚基因组上开发了31K。多态信息含量在0.27~0.37之间,LD衰减距离At和Dt亚基因组分别为0.55和0.78Mb。
3利用系统发育树分析,可以将所有的棉花材料分为两个亚群,1号群有个样品,2号群有个样品,利用群体结构分析,将棉花也分为两个群,与系统发育的结果一致。材料本身并不高度分化,因此可以进行后续的GWAS分析。
4利用BLUP处理性状后利用GAPIT进行GWAS分析,确定了30个GWAS的关链信号。其中有1/3的关联信号在3个环境中都定位到了。其中有8个SNP与PH相关,5个分布于D03而3个分布于D05上,其中D03的SNP有较高的表型贡献率,其中有两个SNP在所有的环境中都定位到了;与FBL来说,确定了11个重要的SNP,分别定位在A02、A11和D03上,最重要的定位在D03上。FBA在7号染色体上定位到了6个相关的SNP,FFBP与HFFBP均定位到了D03上,其中D03_基本在4个性状中都获得了关联信号,因此反映了株型基因的总要性。
5进一步的研究表明,在D03上定位到的区域使连续的,所有的4个性状均定位到了一个0.55M的区域。我们利用LD分析确定了HAP1(ACAA),Hap2(ATAA),Hap3(GCGG),Hap4(GTAA)和Hap5(GTGG)的5个峰单核苷酸多态性在四个相关SNP中表现出紧密相关的水平在我们的人口中。Hap2的平均PH值,HFFBP和FBL分别为54.36,14.88和10.14厘米,低于Hap3,Hap5和Hap1。相反,平均PH值,HFFBP和FBL,Hap3大于其他四个。
6在关联区域内进行研究,确定了21个基因,其中有7个基因是没有任何的功能和注释的,在具有一些生物功能注释的14个基因中,三个基因与参与植物发育的生物途径相关,包括细胞分化和植物形态。预测其他基因参与运输,转录调控和信号转导等。利用qRT-PCR确定了Gh_D03G是一个显著差异表达的基因,该基因的直系同源物是一个MADS-bos家族的基因,参预细胞分化和体重测定。
7利用VIGS将棉花的Gh_D03G沉默后,在不同时间,GhD03G沉默植株的PH明显高于pCLCrVA和pCLCrVA:PDS植株。这些结果表明GhD03G负责陆地棉中的PH。
Genome?wideassociationstudyidentifedgeneticvariationsandcandidategenesforplantarchitecture白癫疯的方法北京中科医院是骗子