随着高通量测序技术的不断发展,单纯的微生物群落结构早已满足不了现今科研人员的研究需求。而通过各类数据库的对比不断拓宽了研究层面,而KEGG是现今应用最为广泛的数据库之一。
KEGG,KyotoencyclopediaofGenesandGenomes,京都基因和基因组百科全书,是系统分析基因功能,联系基因组信息和功能信息的知识库。
KEGG数据库
KEGG中的pathway是根据相关知识手绘的,这里的手绘的意思可能是指人工以特定的语言格式来确定通路各组件的联系;基因组信息主要是从NCBI等数据库中得到的,除了有完整的基因序列外,还有没完成的草图;另外KEGG中有一个“专有名词”KO(KEGGOrthology),它是蛋白质(酶)的一个分类体系,序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,然后打上KO(或K)标签。下面就首先来讲一下KEGGorthology。
任找一个代谢通路图,在上方有pathwaymeue
payhwayentry
Show(Hide)description
这3个选项,点击pathwayentry,出现了一个页面,这个随时被连接出来的页面相信大家一定再熟悉不过了。在这个页面中的pathwaymap项中点击按钮状的链接Orthologtable。就进入了Orthologtable如下的页面:
在这个表中,行与物种对应,3个字母都是相应物中的英文单词缩写,比如has表示Homosapiens,mcc表示Macacamulatta;列就表示相应的Ortholog分类,比如K就表示生物体内的己糖激酶hexokinase这一类序列和功能相似的蛋白质类(酶类)。如上图has后有,,这3个条目,它表示在人类细胞中中存在3中不同的己糖激酶,它们分别由以上这3组数字代表的基因所编码,这3组数字应该是这3个基因的登录号。空白则表示在该物种中不存在这种酶。
点击K则这一KO分类信息及成员列表都可显示出来;点击has则链接到物种(人类)基因组去了;点击P,则显示相应的代谢通路。下面我们点击,如下:
如上图,就是我们常见的一个页面,是KEGG中的基因ID(登录号),H.sapiens表示物种,然后是基因的名称,表达的酶,属于哪个KO分类以及参与哪些代谢途径;下面还有结构、序列信息等等。
所以从Orthologtable中可以很容易地知道一张代谢通路上有哪些KO分类(酶类),并且这些酶类的成员在各物种中分配存在的情况以及特定的名称。
怎么看KEGG中代谢通路图
比如以上这个图,方框一般就是酶,方框里面的5.4.2.2不是IP而是EC编号;小圆圈代表代谢物,你把鼠标放上去,(别放我这上面,放KEGG中去)会出现C的东西,C代表北京白癜风医院可以治疗吗单唾液酸四己糖神经节苷脂钠注射液说明书