hyperR轻松带你搞定基因富集分析

中科白癜风微信账号 https://m-mip.39.net/baidianfeng/mipso_4448284.html

在基因差异表达分析之后,如果得到了好多p值特别小(也就是显著性很高)的基因,那么下一步怎么办呢?是选择一些基因用于验证?对其中基因进行后续研究?

这些想法都是可行的,但是差异表达找到的基因往往很多,去找每一个基因的详细资料,工作量还是很大的。其次,如果我们单纯觉得某一个基因和研究的课题相关而去进行下游分析,那么这个行为是不是不够客观。为了让审稿人相信我们的分析结果,那么就需要做一个基因富集分析。基因富集分析(genesetenrichmentanalysis)是在一组基因或蛋白中找到一类过表达的基因或蛋白,常见的有基于差异基因的Over-representation分析,也就是常说的GO、KEGG富集分析和Functionalclassscoring分析,如GSEA。富集分析一般是高通量实验,如基因芯片,RNA-Seq,蛋白质组学(质谱结果)的后续步骤。通过基因通路富集分析,可以初步分析基因可能参与的生物学过程或者信号通路。

GeneSetEnrichmentAnalysis(GSEA,基因集富集分析)用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的贡献。这与先筛选差异基因,再判断差异基因在哪些注释的通路存在富集的GO富集分析是不同的。

GSEA不局限于差异基因,从基因集的富集角度出发,更容易包括基因表达细微变化对生物通路的影响。现有的GSEA分析工具,如Enrichr,fgsea和clusterProfiler在应对GSEA分析中灵活性略有不足,特别是在分析跨多项实验的数据时。

今天小编给大家推荐一个用于基因集富集分析的更为全面的R包:hyperR。它提供了多种分析增强、数据可视化和结果共享的方法,此外还提供了分层基因分析以及内置markdown等功能。此外,用户还可以导入自定义的数据集,将基因分析扩展到其他领域,如蛋白质组、微生物组、代谢组等。hypeR是一个由R编写的Bioconductor包,核心功能是接受一个或多个基因标签和基因集(geneset)进行基因功能富集。基因标签名可以是单独一个向量,或者加权的排序向量。前者适用于基因簇,例如通过共表达分析确定的基因簇,而后者适用于对基因进行排序的情况,即通过差异表达分析确定基因簇。同时,hypeR的模块化功能还可以可视化其他流行分析工具的基因富集数据,只需要将数据集输出为hyp对象。

那么接下来,大家就跟着小编来体验一下吧。

1

自定义基因集的简单示例

#如果遇到安装github上R包报错(无法打开url),在internet选项高级勾选TLS1.0、TLS1.1、TLS1.2即可。

接下来我们开始使用hyperR进行基因富集工作,基因集是一个向量列表,用户可以使用GSEA


转载请注明:http://www.bjgongshangzhuce.com/jyzl/6149.html


当前时间: