1、基因富集分析是什么?
基因富集分析主要是对基因芯片或高通量测序得到大量差异基因进行分析,以帮助了解这些差异基因可能影响的生物功能,可快速聚焦到跟研究疾病密切相关的重要分子上,为后续实验验证提供方向和依据,如果能得到预期的实验结果,就能从分子层面阐释基因的功能现象。
2、基因富集分析的原理是什么?
仅仅一个基因列表又怎么能进行功能富集统计分析呢?又没有对照,怎么计算p值呢?这里举个例子:在一个广场上从早上到晚上都有着各种活动,早上5-6点有老人在锻炼身体,7-8点广场上开始有小贩、游客和行人,到了下午有不少青年人举行商业促销活动,傍晚广场就是属于广场舞大妈,晚上夜宵排档四起。那么当我们在不知道时间的情况下,抽取广场个人,是否能从这百人的列表推测出广场上正在进行的活动或者时间呢?当人群中有80%的人是大妈?那么广场上进行什么活动在什么时间就显而易见吧。那么人换成基因也是同理的。基因富集分析时,首先要定义基因集(geneset),也就是基于我们的先验知识(基因组注释信息)。将基因富集可以想象成代表某一功能活动的群体,每个个人可能同时参与好几种功能活动,我们所分析的不是单个个体的差异,而是实际群体和期望功能群体是否有差异,从而推测出此时此刻发生了什么事,在这些事件中哪些个体又起到了什么作用。
3、基因富集分析哪些分类?
基因功能富集分析目前主要有三类GO,KEGG和DO富集分析
GO富集分析
GeneOntology(GO)项目是一个通过共同的语义term来描述基因生物学功能的项目。GO分析主要包括三个层面:分子功能、生物过程和细胞组分。
为了尽可能详细的提供功能信息,基因产物被尽可能的富集到最低层的功能term上。比如说,如果一个基因产物被定为在perinuclearspace(核周区间),那么他只会定位到这个特定的term,而不会定位到它的父亲节点或其他上级term中。在此例中,perinuclearspace就是nucleus的子节点,然而对于一些其他的目的,比如为了分析微阵列数据的结果,那么单独对于某一个基因进行注释已经不能满足我们的分析要求了。而是需要更为复杂的统计学计算过程,即通过超几何分布等算法,从GOtermtree上找到和inputgenelist显著相关的功能term。GOTermFinder为我们提供了这样的算法和分析过程。
KEGG信号通路富集分析
KEGG:(KyotoEncyclopediaofGenesandGenomes)是系统分析基因产物和化合物在细胞中的代谢途径以及这些基因产物的功能的数据库。它整合了基因组、化学分子和生化系统等方面的数据,包括代谢通路(KEGGPATHWAY)、药物(KEGGDRUG)、疾病(KEGGDISEASE)、功能模型(KEGGMODULE)、基因序列(KEGGGENES)及基因组(KEGGGENOME)等等。KO(KEGGORTHOLOG)系统将各个KEGG注释系统联系在一起,KEGG已建立了一套完整KO注释的系统,可完成新测序物种的基因组或转录组的功能注释。
疾病分类富集分析
DO,diseaseontology是一个根据基因对疾病进行分类的注释。疾病间相似关系的研究对于复杂疾病发病机制理解、重大疾病早期预防、诊断、新药物研发及药物安全评估具有重要作用。(举例:一些牙齿疾病与一些重要系统性疾病,如消化系统疾病、糖尿病、甚至神经系统疾病(如老年痴呆)等有着密切关系。)
2、图表示例
图1、GO功能富集分析图、KEGG通路富集分析图
图2、DO疾病富集分析图
图3、构建人类健康基因组学和疾病生物标志物挖掘的原型图数据库的语义模型,简化了跨物种和跨知识领域的基因型到表现型的探索。
3、参考文献:
DessimozC,?kuncaN.TheGeneOntologyHandbook[J].
ConsortiumGO.TheGeneOntologyprojectin.[J].NucleicAcidsResearch,,36(Databaseissue):-4.
KanehisaM,GotoS.KEGG:KyotoEncyclopediaofGenesandGenomes[J].NucleicAcidsResearch,,27(1):29-34.
OsborneJD,FlatowJ,HolkoM,etal.AnnotatingthehumangenomewithDiseaseOntology.BmcGenomics,,10Suppl1(S1):S6.
SchrimlLM;ArzeC;NadendlaS;ChangYW;MazaitisM;FelixV;FengG;KibbeWA.DiseaseOntology:aackbonefordiseasesemanticintegration.[J].NucleicAcidsResearch,,40(Databaseissue):-6.