基因组技术分享多倍体如何区分亚基因组

北京那个医院看白癜风最好 http://m.39.net/pf/bdfyy/bjzkbdfyy/
随着测序及组装技术的不断发展,越来越多的多倍体甚至单倍体基因组被提上了日程。技术的发展使得基因组组装质量确实有了非常明显的提升,但是关于组装后数据挖掘方面,多倍体基因组或者多套基因组应该怎么分析,了解的朋友还是太少。借此机会,给大家分享一下相关的项目数据挖掘经验,希望对大家有所帮助。说到多倍体,后续研究重点内容和常规二倍体之间是差异很大,特别是分析方法上,并不是所有的都能套用二倍体的分析套路。要对多倍体进行分析,在基因组组装完成后,首先第一步应该是区分基因组。因此本期主题是“多倍体如何区分亚基因组”。

多倍体基因组主要分为同源多倍体,异源多倍体。常见的异源多倍体有很多,比如普通小麦(AABBDD),二粒小麦(AABB),芥菜(AABB),油菜(AACC),陆地棉/海岛棉(AADD),栽培花生(AABB)等。多倍体的起源有很多种原因,不同的低倍性的个体之间杂交加倍,甚至人工直接干预诱导都可以形成。一般来说,如果是人工杂交形成的,那么形成个体的祖先来源还是比较清楚的。当然之前不清楚的也有不少,甚至有些争论,比如八倍体草莓的祖先来源问题。目前来说,多倍体的起源问题仍旧是许多物种的研究热点。

图1.芸薹属禹氏三角(FromWikipedia)

那么如何确定亚基因组的组成或者对多倍体基因组进行溯源呢?一般来说,最直接的方法需要的祖先材料利用基因组序列的相似性及共线性去区分。通俗的讲就是找相似性!比如一个四倍体AABB,在知道有A基因组和B基因组的近源或者祖先序列的的情况下,直接将组装出的AB基因组分别去和A及B基因组进行序列比对和共线性分析就可以区分出来。序列相似性越高,共线性越好,那么来源于同一祖先的可能性越大。

图2进化树-芥菜A亚基因组起源1

如上所述,是针对A和B两套亚基因组之间差异较大,且具有近源物种的情况下。例如陆地棉/海岛棉(AADD)的A与D亚基因组,芥菜(AABB)的A与B亚基因组,油菜的A与C亚基因组,都可以通过这种方式分离出来。然而不同的多倍体亚基因组之间差异程度不同,刚说的油菜的A与C之间的相似程度就比芥菜的A与B之间的相似程度更高。亚基因组之间差异越大越好分,差异越小越难分。具体如图3,相似度abcd。

图3示例图

对于有参考的情况下,无论多么相似,始终都能通过和疑似祖先种之间的差异程度区分出亚基因组。这种方法已经很常见了,比如芥菜基因组,棉花基因组,花生基因组的亚基因组区分都采用了这种方法。那么在无祖先亚基因组的情况下怎么办呢?俗话说车到山前必有路,没有祖先亚基因组,那就选择一个最近源的二倍体物种,或者说最近的共同祖先分化而来的物种。

具体怎么选择这个近源物种?核心是判断出最近的物种!这个近源种肯定是与自身研究物种的亲缘关系越近越好,这个相对比较好理解。判断近源程度的方法,最直接的就是通过进化树。进化树的构建方法有很多种,无论用SNP还是核心基因集或者保守基因都可以,这里就不缀述了。另外直接通过基因组序列比对也是一个非常高效的选择。比如通过MuMmer进行两个基因组之间的序列比对,确定大片段的共线性片段后,判断共线性片段间的序列相似性。

有了这个参考之后,后续一切就好办了,生信和实验上都能有区分的办法。这里给大家分享的有以下几个方法:构建分染色体进化树,共线性基因对KS值,染色体共线性。

1.构建分染色体进化树:

主要步骤:

a.研究物种自身两套基因组之间比对,确定同源染色体对;

b.研究物种与参考物种基因组之间序列比对,确定同源染色体;(参考物种最好染色体数与研究物种亚基因组染色体数一致,避免不必要麻烦。切记切记,经验之谈!!!)

c.通过共有基因绘制每一组染色体进化树;

2.共线性基因对KS值:

主要步骤:

a.研究物种自身两套基因组之间比对,确定同源染色体对;

b.研究物种与参考物种基因组之间序列比对,确定同源染色体;

c.寻找共线性同源基因对;

d.计算同源基因对KS值,通过整体KS值大小判断亲缘关系;

3.染色体共线性;

主要步骤:

a.研究物种自身两套基因组之间比对,确定同源染色体对;

b.研究物种与参考物种基因组之间序列比对,确定同源染色体;(参考物种最好染色体数与研究物种亚基因组染色体数一致,避免不必要麻烦);

c.比较每组染色体之间的共线性程度来区分亲缘关系;

d.通过组内整体的共线性片段序列相似性验证亲缘关系;

单纯通过其中任意一种方法都能区分出两套染色体,但是如果只通过一种方法出来的结果往往显得证据不太充足。比如上面介绍的案例中,绝大部分亚染色体都能很好的区分出来,但是不同染色体对之间的进化树枝长差异程度不一样,有可能差异很小,这个时候需要更多证据做补充。最好能够搭配着使用,这样确保结果有更高的可靠性。无芒隐子草基因组为异源四倍体,但是其祖先二倍体种基因组是缺失的,以上方法在无芒隐子草基因组亚基因组区分中就得到了很好利用。如图4,通过利用隐子草与水稻基因组分染色体间共线性确定了同源染色体组,最终通过同源染色体间1对1共线性基因对之间的进化关系区分出了亚染色体组。通过KS及共线性序列间的相似度对进化树的结果进行了验证2。

图4隐子草与水稻基因组之间分染色体进化关系

由于测序技术的飞速发展,三代测序,光学及Hi-C等技术手段能够直接将高质量的多倍体基因组甚至是同源多倍体基因组组装出来。二倍体组装两套,三倍体组装三套,4倍体组装出4套等都不再是稀奇。这些相对特殊的基因组应该如何挖掘?且看下期:多倍体基因组如何研究?

参考文献:1.YangJ,LiuD,WangX,etal.ThegenomesequenceofallopolyploidBrassicajunceaandanalysisofdifferentialhomoeologgeneexpressioninfluencingselection[J].Naturegenetics,,48(10):-.2.ZhangJ,WuF,YanQ,etal.ThegenomeofCleistogenessongoricaprovidesablueprintforfunctionaldissectionofdimorphicflowerdifferentiationanddroughtadaptability[J].PlantBiotechnologyJournal.百迈客现提供“测序分析+分子试剂”一站式解决方案,与分子实验相关试剂盒如提取试剂盒、反转试剂盒、qPCR试剂盒、PCRMix、无缝克隆、建库试剂盒等试剂盒均有现货,试剂促销活动详情可咨询驻地销售专员!

文:隔壁老李

排版:市场部

邀请函

第七届全国功能基因组学高峰论坛

即将开始!

直播时间:年10月20日13:00-18:00

直播地点:还在测试,敬请


转载请注明:http://www.bjgongshangzhuce.com/jyyf/6825.html


当前时间: