前言
黄鳍金枪鱼(Thunnusalbacares,YFT)在全球范围内具有相关的生物和经济重要性,是海洋生态系统中的顶级捕食者,是世界第二大金枪鱼渔业。尽管适当的鱼群管理需要对鱼群结构及其与环境和生态条件相关的遗传变异有准确的了解,YFT的遗传群体结构尚未得到解决。不同的研究提供了不一致的YFT全球范围的遗传分化模式,以及在区域水平上检测到的基因结构。这种不一致性可能是由于YFT的生活史特征(如高繁殖力、大种群规模),这使得在种群样本中检测遗传分化模式非常困难。由于经典标记的遗传分辨率有限,无法检测种群结构,可能会对管理产生潜在的误导,导致局部过度捕捞和种群严重减少。根据YFT种群结构和规模的不确定性,显然需要开发基于基因组学的替代方法,允许在整个基因组中筛选更多的标记,包括中性和非中性基因座。基于新一代测序(NGS)的基因分型方法的迅速出现,极大地提高了我们分析整个基因组中数千个单核苷酸多态性(SNP)标记的能力,提高了在地理种群中检测小的遗传分化的精度。尽管由于只有四种可能的等位基因状态,SNP的特征是多样性低,但这种限制很大程度上被它们的丰度所超越,它们的频率为每几百个碱基对中有一个SNP。此外,SNP正成为种群生态学、进化和保护遗传学中许多应用的标记选择,在基因分型效率、数据质量和低得分错误率、全基因组覆盖和分析简单等方面具有很高的潜力。
在这里,首次应用了2b-RAD基因分型测序(GBS)技术,测试了该技术在研究非模型大型中上层鱼类和高度洄游鱼类种群遗传结构方面的潜力。这一新的基因组工具基于IIB型限制性内切酶产生的序列减少表达文库,它将基因组DNA的上下游位点切割,生成均匀长度的标签,这些标签非常适合于现有的NGS平台的测序。这种方法允许对标签库进行并行和多路样本测序,以快速发现整个个体基因组中的数千个SNP,这是一种非常划算的过程,从而实现高基因组覆盖率。2b-RAD方法可以同时筛选基因组中几乎所有的限制性内切位点,而其他GBS方法只能针对总限制性内切位点的一个子集,以弥补由于限制性内切片段过大而造成的PCR扩增和测序效率的损失。该技术还允许通过选择性适配器来微调标记密度,以便对较少的高覆盖率的基因座进行排序,用于群体遗传学等应用。鉴于这些属性,2b-RAD方法有潜力区分存在的遗传分化具有较高的统计能力,生成全基因组数据,为YFT群体在不同空间尺度的遗传结构分析。
结果与讨论
在质量过滤前后,TRs之间得到了相似数量的reads(表1),这强调了该技术在个体基因分型中的可靠性。
表1技术复制的详细信息:首字母缩写(样本ID)、海洋来源、基因组DNA浓度(ng/μL)、文库浓度(nm/μL)、获得的原始reads数量、质量过滤后的保留reads及其对应的百分比
在考虑的不同Stacks设置中,‐m值是最影响基因分型结果的参数,特别是检测到的SNP数量。对TRs进行的敏感性测试显示,当‐m从5增加到15时,SNP数量减少,从减少到(图1和补充材料1给出了相关标准误差值)。错误率的百分比大约在1%到5%之间,随着‐m值的增加,错误率呈下降趋势(图1和补充材料1)。随着‐m值的增加,杂合SNP的百分比保持不变(图1和补充材料1)。
与默认SNP模型相比,使用有界SNP调用模型观察到真实杂合SNPs调用增加,并降低了上界值,这与Mastretta-Yanes等人的结果一致。通过放宽每个基因座(‐n)内和基因座(‐M)之间的不匹配数量,可以观察到SNP数量和错误率的增加(补充材料2)。对蓝鳍金枪鱼基因组进行2b-RAD测序,成功测序的序列比例很高(86.59%)。使用ref_map.pl程序从TRs中获得的数据输出证实了使用denovo_map.pl程序观察到的趋势(图1)。然而,SNP的绝对数量低于通过denovo_map.pl程序获得的,可能是由于所使用的参考基因组不完整以及YFT与蓝鳍金枪鱼之间的系统发育距离。
此外,当‐m增加时,错误率也显示出不太明显的下降模式,但证实了基因分型中的错误率较低(5%)。相反,杂合子的百分比当m值较高时,以蓝鳍金枪鱼基因组为参照的SNP从35.6%小幅增加到40.7%(图1)。
图1使用不同的‐m值,比较(a)SNP数量(黑点)(b)错误率(红点)和(c)杂合基因座百分比(蓝点)方面的denovo_map.pl(左面板)和ref_map.pl(右面板)性能每个点代表三个人的TRs的平均值
基于两种不同方法(使用或不使用参考基因组)识别出的snp数量,TRs中获得的杂合snp的低错误率和一致百分比,denovo_map.pl程序是运行应用以下参数设置-m=8,-M=3,-n=2和有界SNP调用模型的上限0.1(所有剩余的Stacks设置为默认),获得最终的数据集(见补充材料3)。AMOVA结果(补充材料4)显示,将样本集中到三个主要海洋区域,其群体细分解释的变异百分比最高(2.73%P-value0.),同时组内群体间差异极低且不显著(0.97%P-value0.01)。将YFT个体集中到三个大洋对应的三组中(表2),可以增加样本量,得到更稳健可靠的群体结构推断。
表2概述三个黄鳍金枪鱼海洋群本表报告:抽样来源(位置)样本量(No.个体),带有相关标准错误(SE)的原始读取的平均值(百万),相应的fifilteredreads(SE)的平均值(百万)、保留reads的百分比、唯一标签的平均值、多态SNP和发现SNP的数量
优化过程将不同的‐r和‐p参数值组合在一起,最终得到‐r=0.7和p=6作为SNP数量和缺失值百分比之间的最佳中间值(表3)。
表3根据Stacks群体方案的‐r和‐p参数值,获得整个数据集的单核苷酸多态性数量和缺失值百分比(NA%)
这组参数产生了个SNP。用该数据集计算的Fst距离非常显著,表明海洋群体之间存在遗传差异(表4)。
表4在黄鳍金枪鱼的地理分布(大西洋、印度洋和太平洋)中计算出的成对Fst值(对角线下)及其相关的p值(对角线下)Bonferroni标准校正后的显著值以粗体显示(名义有效阈值α=0.01)
DAPC证实了海盆的成因分化。聚类数(k)递增的BIC值图显示,k=3对应的相关BIC值最小。在进行PCA分析的数据转换步骤中,保留了30个主成分(PCs),约占总遗传变异性的92%。DAPC的特征值表明,前两个成分解释了大部分的变化。由此得到的散点图(图2)显示了三个遗传集群对应于大西洋、印度和太平洋的YFT群。此外,在我们的数据集上进行的DAPC交叉验证表明,与最高平均成功和最低均方误差相关的PC数量对应于35个PC。这个结果支持了在DAPC降维步骤中保留30个PC的选择。
图2DAPC结果的散点图确定了三个遗传簇
这些结果与Ward等人通过GPI-A位点的等位基因频率显著差异观察到的海洋间遗传异质性特征一致(PGI-F)。虽然这种情况需要通过增加样本量来证实,但它证明了2b-RAD基因分型技术是在全球范围内评估YFT基因结构和多样性的有力工具。
结论
这一方法学研究证实了TRs对优化基因分型程序是有用的,并且对于减少由于PCR产物在等位基因频率估计中引入的统计误差是至关重要的。本文明确地将TRs标签与蓝鳍金枪鱼的参考基因组相对应,成功率很高(86.59%),尽管片段的大小以及这两个物种之间的进化距离很小。方法表明,缺少参考基因组虽然是不可取的,但并不明显影响所获数据的重现性和准确性,这是个体基因分型技术的一致性的基础。初步证明,在海洋高基因流动物种中,2b-RAD是一种很有前途的工具,可以筛选出大量的基因组位点,为大洋间种群的遗传分化提供依据。当然,在较小的地方地理规模下,要处理YFT群体样本间遗传分化的估计,需要增加样本规模。
原文链接: