混池测序法结合草鱼基因组筛选Y连锁标记和

今天与大家分享一篇来自ScientificReports上的文章,ComputationalidentificationofY-linkedmarkersandgenesinthegrasscarpgenomebyusingapool-and-sequencemethod,混混池测序法结合草鱼基因组筛选Y连锁标记和基因,文章的引用信息如下:

草鱼(Ctenopharyngodonidellus)是重要的淡水养殖鲤科鱼类,通过全基因组鸟枪法分别对雌核发育成年雌性和野生成年雄性进行测序。与斑马鱼基因组比较分析表明,草鱼的LG24连锁群对应斑马鱼的10号和22号染色体,这表明草鱼基因组在进化过程中经历了染色体融合。在本研究中,基于已有雄性草鱼基因组数据,在鉴定鱼类性别标记过程中测试了混池测序法(pool-seq)的适用性和可靠性。通过计算获得了Kb的Y连锁序列和14个Y连锁基因。其中,六个Y连锁序列是雄性特异序列。此外,一个Y连锁基因--泛素连锁酶基因(ubq-y)在雄性特异表达,对该基因的进一步研究可能有助于阐明其在性别决定和分化中的作用。

实验结果

1

性别比例统计

从全同胞家系中随机选择90条草鱼个体(18月龄)并解剖,在显微镜下观察性腺的发育情况。性腺的显微照片如图1所示。性别鉴定的结果表明,性别比接近1:1,包括47条雌性和43条雄性。此外,雌核发育种群的90只草鱼个体均为雌性。性别比例统计证实草鱼具有异形XX/XY性染色体系统。具有两个X染色体雌性是同配性别,具有X和Y染色体雄性则是异配性别。

图个月龄草鱼的睾丸和卵巢显微照片。(a)10x的睾丸显微照片。(b)10x的卵巢显微照片。

2

DNA重测序分析

从全同胞群体中选择了18个月龄的30只雌性和30只雄性草鱼个体。提取DNA,并构建两个DNA混合池(pools),以下称为雌性池和雄性池。使用RepeatMasker将重复区域作为分隔符对雄鱼基因组(male-gc-assembly)进行拆分。获得,个序列片段,大小为Mb,N50值为1,bp。来自雌性池和雄性池的cleandata大小为33.33Gb和32.93Gb,分别包括,,和,,个reads(表1)。尽管雌性池read数量高于雄性池,但前者匹配次数(,,)少于后者(,,),匹配率分别为69%和72.58%。雄性池高匹配率表明参考基因组中存在雄性特异序列。

表1混池文库测序数据

3

Y染色体连锁scaffolds鉴定

Fi-reads是雌性池在雄性基因组匹配的序列,而Mi-reads是雄性池在雄性基因组匹配的序列。Ri表示将Fi数量除以Mi数量的比率,Ri-norm值是Ri归一化数值,用于描述雌性细胞与雌性细胞之间read于参考基因组的比对比率差异。雄性池中所有片段的平均Ri-norm值为0.。将Ri-norm值阈值设置为0.3,以区分Y连锁片段与常染色体和X片段。考虑到误差可能是由低覆盖率引起的,因此排除Mi-reads小于15的片段。最后,将个Ri-norm值为0到0.3的片段暂时认定为Y连锁片段,涉及个scaffolds,大小为1,Kb。在个片段中,有个Ri-norm值低于0.15。

Y染色体scaffolds由许多Y连锁的片段组成,与常染色体scaffolds相比,Y染色体scaffold具有更高比率的Y连锁片段。对个scaffolds进行了富集分析,仅P值低于1e-认为是显著富集的。在个scaffolds中,有6个scaffolds具有更多Y连锁片段,其Ri-norm值小于0.3(P值1e-)。这六个scaffolds是Sca,Sca,Sca,Sca,Sca和Sca(表2)。以Sca为例,Sca的长度约为45,bp,具有28个Y连锁片段,其中18个Ri-norm值低于0.3,10个Ri-norm值低于0.15,Sca的P值为2.e-44。图2显示了源自不同染色体的scaffolds的Ri-norm分布差异。与常染色体连锁的scaffolds(Sca0)相比,Y-连锁的scaffolds具有较低的Ri-norm值(?0)。相反,推定的X连锁scaffolds(Sca)具有较高的Ri-norm值(?2)。因此,六个scaffolds(总大小为Kb)更可能来自Y染色体。

表2使用超几何检验对Y-连接的scaffolds进行的富集分析。

基因组中总片段数(N)为,;基因组参考(n)中的片段总数(Ri-norm0.3)为。常染色体scaffold作对照。

图2Ri-norm分布在不同染色体片段之间的差异。粉色圆圈表示片段的Ri-norm值。x轴表示不同的片段,y轴表示Ri-norm值。scaffold通过其ID号显示。与Ri-norm值为?1的常染色体连锁scaffold相比,Y连锁scaffolds的Ri-norm值较低(?0),而X-连锁scaffold的Ri-norm值较高(?2)。

4

Y连锁scaffolds上存在大量重复序列

对于六个Y连锁scaffolds,分析了其重复序列含量。与整个雄性基因组重复序列(17.53%)相比,Y-连锁scaffolds的重复序列占比高达30.71%。此外,发现Y连锁scaffolds上逆转录转座子(retroelements)含量更高。逆转录转座子的占比是整个基因组序列的近五倍(17.16%比3.53%)。此外,Y型连锁scaffolds上长散在重复序列(longinterspersednuclearelements)占比为10.43%,是基因组(1.34%)的10倍。此外,在Y-连锁scaffolds中存在长末端重复序列(long-terminal-repeat),L2/CR1/Rex,散布和简单的重复序列(interspersedandsimplerepeats)。尽管如此,在Y连锁的scaffolds和整个基因组中都存在相似的DNA转座子发生率(10.41%比12.03%)。

5

PCR检测全同胞家系Y连锁序列

从六个scaffolds中选择一批Y-连锁序列,用于进一步在全同胞人群中进行PCR验证。为了提高筛选效率,选择阈值较高的片段(Ri-norm0.15)。因此,共选择了75个片段用于后续分析。在雌性基因组进行BLASTN比对,并去除bestblasthits(E值1e-)片段。最终,在全同胞群体中保留了五个scaffolds(Sca,Sca,Sca,Sca和Sca)上的17个序列。进行PCR扩增以测试准确性。当在雄性中检测到单个清晰的扩增条带时,片段被定义为Y连锁,而在雌性中未观察到扩增条带或仅观察到大小不同的低强度条带。全同胞家系PCR结果表明,大多数Ri-norm小于0.15的片段仅在雄性中扩增,准确性为94.12%(16/17)。表3和图3显示了五个scaffolds的代表序列的部分全同胞PCR结果。因此,五个scaffolds被认定为Y-连锁。上述结果表明,具有低Ri-norm值的片段倾向于是Y染色体序列,并且片段比例法对于鉴定草鱼中的Y连锁序列是可靠的。

表3Ri-norm0.3的Y连锁片段。

Y代表仅在雄性个体中扩增的序列,而N代表在雄性和雌性个体中扩增的序列。

图3全同胞草鱼中五个代表性的Y连锁片段的PCR验证。

6

PCR验证野生种群Y特异序列

不同家系之间遗传背景的差异可能会导致Y染色体的序列差异并影响测试效率。因此,收集了不同水系(珠江,长江,湘江,老挝河)的八条雌鱼和八条雄鱼。在野生草鱼中进行PCR验证,以确认Y连锁序列是否在野生雄性个体具有特异性。但是,野生草鱼进一步PCR的结果低于我们的预期。Sca的所有六个序列(Sca_3_,Sca_30_,Sca_4_,Sca_9_和Sca_32_,Sca_34_)仍呈现雄性特异性扩增(见图4)。这些序列具有用作性别特异性分子标记的潜力。相比之下,其他11个序列(Sca_15_,Sca_33_,Sca_63_,Sca_77_,Sca_22_,Sca_52_,Sca_68_,Sca_93_,Sca_22_,scasav_)在部分野生雌鱼中扩增。

图4野生草鱼个体中Sca序列的PCR验证。

7

Y连锁基因注释

将五个Y连锁scaffolds(Sca,Sca,Sca,Sca和Sca)用于基因注释。通过BLAST共注释14个基因,并根据其假定功能进行了命名,或者对没有先前功能描述的基因命名为“un-y”。表4和图5列出了所有与Y连锁的基因的详细信息。鉴定了位于Sca和Sca的3个神经病毒毒素亚基beta基因(nsb-y1,nsb-y2和nsb-y3)。这些基因包含III型纤连蛋白(Fibronectintype-III),neoverrucotoxin亚基结构域,并预测其在微管组织和稳定中发挥作用。此外,在Sca和Sca中鉴定出两个含有NACHT,LRR和PYD域的基因拷贝(nacht-y1和nacht-y2),它们在先天免疫和炎症中起作用。RNA指导的DNA聚合酶基因(rdp-y1,rdp-y2,rdp-y3和rdp-y4)广泛分布在这四个scaffolds中,并且可能在DNA复制中起作用并响应遗传毒性应激。在Sca28中鉴定出两个类似反转录转座子的基因(retro-y1和retro-y2)。在Sca中鉴定出一个名为ubq-y基因,该基因被认为是含有锌指结构域的E3泛素连锁酶。以上所有基因均具有Ref-Seq,并且与具有已知功能的蛋白质具有同源性。此外,针对草鱼注释基因的核苷酸BLAST结果显示,除ubq-y基因外,所有基因均具有雌性同源物,具有较高的序列一致性。ubq-y的编码序列明显不同于其雌性同源序列。在Sca和Sca中检测到另外两个基因,核苷酸BLAST结果显示它们仅具有EST证据,与具有已知功能的蛋白质没有相似性。将它们命名为未知功能基因(un-y1,un-y2),这两个基因可能是新基因。BLAST结果表明,许多基因是不完整的,并且其中一些缺乏外显子,因为Y-连锁的序列由于存在于Y染色体上的高度重复的序列而导致序列装配错误。因此,通常需要对互补DNA进行重新测序和快速扩增以完全注释Y连锁基因。

表4Y-连锁基因注释

图5Y连锁scaffolds(Sca,Sca,Sca和Sca)预测基因结构

8

Y连锁基因表达分析

大多数Y连锁基因显示出与雌性同源物的高度相似性,由于同源性较高的序列,很难测试其是否在雄性特异性表达。因此,我们只选择了四个基因,包括三个基因(ubq-y,un-y1,un-y2),缺乏高度相似的雌性同源物,而另一个基因rdp-y4却具有高度相似的雌性同源物。在四个雌性和雄性组织(B:大脑,H:下丘脑,G:性腺,P:垂体)中进行表达实验。结果显示在图6中。我们发现rdp-y4基因在两个性别的所有四个组织中都高表达,从而证实了cDNA模板的质量。因此,rdp-y4可以用作阳性对照。值得注意的是,ubq-ymRNA在两个雄性组织(下丘脑和垂体)中高表达,但在雌性组织中未检测到。在雄性神经内分泌组织中的表达特异性表明ubq-y可能在性别分化中起作用。相比之下,un-y1和un-y2基因在两个性别中均未扩增,表明它们可能在发育阶段表达,例如胚胎或仔鱼阶段。

考虑到ubq-y基因仅存在于雄性草鱼中,将其翻译的编码序列与雌性同源物进行了比对。比对结果显示氨基酸位点普遍存在差异(图7a),这表明ubq-y是不同的旁系同源物(氨基酸一致性为75%)。ubq-y基因的系统发育分析表明,在某些鱼类中,该基因与其雌性同源基因有所不同,例如犀角金线鲃(Sinocyclocheilusrhinocerous)(图7b),它也是鲤科的有鳍鱼类。相比之下,尽管是同一鲤科,但在斑马鱼中未检测到ubq-y直系同源物。表达和序列证据均揭示了ubq-y基因的不同功能。

图6两个Y连锁基因(rdp-y4,ubq-y)在雌性和雄性中表达。模板cDNA来自四个组织(B:脑,H:下丘脑,G:性腺,P:垂体)

图7.ubq基因的系统发育分析,以及草鱼ubq-y基因与其雌性同源物的比对。(a)在草鱼中ubq-y基因与其雌性同源物之间编码蛋白序列的比对。(b)ubq基因的系统发育分析

讨论

在本研究中,对草鱼中两种性别的混池gDNA样本进行了全基因组重测序。片段比例法已成功鉴定出五个Y连锁的scaffolds(总计Kb),在全同胞中PCR测试的准确度为94.12%(16/17)。该方法基于雌性池和雄性池之间的比对读数与雄性参考基因组的比值差异。因此,它可以在庞大而复杂的基因组进行,并且可以应用于具有分化性染色体的任何物种。在各个物种中,按照相同的原理成功地描述了许多Y连锁基因。本研究进一步证实了这种比较基因组策略在鱼类中的效果。与传统方法(如AFLP和SNP)相比,这些比较基因组策略更有效,更省时,尤其是检测Y连锁区域和基因。

在野生草鱼种群中,只有17个Y连锁序列的6个雄性特异。可能由于鱼染色体的未分化状态和X与Y染色体之间的频繁交换导致这种现象。对于Y染色体,与X染色体对应物的高度相似性使得难以通过一对引物彼此区分。X和Y染色体之间的相似性越高,发现Y特异性序列和基因的难度就越高。尽管如此,本研究共筛选出6个Y特异性序列(跨度48Kb),这些序列可以用作性别特异性标记,实际上,之前筛选的雄性特异性标记(探针,CI01M)位于Sca上30Kb位置(30,–34,bp)附近,长度为4,bp。此外,该特异标记的扩增产物对应于Sca_34_。

本研究发现Y连锁的scaffolds比整个基因组具有更高的重复序列占比(分别为30.71%和17.53%),在同源性比对的基础上,有14个基因注释。除了un-y1,un-y2和ubq-y基因外,Y连锁基因与它们的雌性同源物显示出高度相似性,其中大多数是分布在至少两个基因座中的多拷贝基因。这种现象表明,尽管重复DNA积累,鱼类中Y染色体的退化水平仍然是原始的。对于Sca,已确认其中六个序列的雄性特异性,但它们全都分布在一个基因区域,但该scaffolds的基因含量仍与雌性同源物(如rdp-y4基因)具有高度的序列相似性。这些发现表明,整个区域的差异程度是可变的,在编码序列中具有高度相似性,而在同一基因区域中,由于突变或插入缺失而导致的相似性较低。

ubq-y基因是一种E3泛素蛋白连锁酶,包含一个锌指结构域,并且与其雌性同源序列具有低序列相似性。RT-PCR结果进一步表明,ubq-y仅在雄性下丘脑和垂体中表达,表明ubq-y基因可能参与草鱼的性别分化和发育。需要进一步的功能研究,例如RNAi沉默,以阐明其生物学作用。序列比对和系统发育分析表明,ubq-y与雌性同源物之间存在广泛的序列差异,表明某些鲤科鱼类中性染色体的分化。

原文链接:


转载请注明:http://www.bjgongshangzhuce.com/jyyf/6333.html


当前时间: