基因集富集分析GSEA中的排序指标它

1

摘要

背景

在不同的实验条件下,有许多方法可以用来描述分子途径或基因本体中基因表达变化之间的复杂关系。其中,基因集富集分析(GSEA)似乎是最常用的方法之一(超过条引文)。影响最终结果的一个重要参数是基因排序指标的选择。应用默认的排名指标可能会导致糟糕的结果。

方法和结果

本研究采用28个基准数据对16种不同排序指标(包括新方案)进行基因集分析的敏感性和假阳性率进行评价。此外,还测试了所选方法对样本大小的稳健性。采用k-means算法,建立了总体灵敏度、总体误报率和计算负荷最高的四个指标,即适度Welch检验统计量的绝对值(MWT)、最小显著性差(MSD)、信噪比绝对值(S2T)和Baumgartner-Weiss-Schindler(BWS)检验统计量。在误报率估计的情况下,所有选择的排序指标对样本大小都是稳健的(鲁棒性)。在灵敏度方面,稳健的MWT的绝对值和S2T的绝对值给出了稳定的结果,而BWS和MSD则在较大样本量下表现出更好的结果。最后,在matlab程序中并行化并实现了包含所有测试排序指标的基因集富集分析方法,网上可用







































盖百霖遮盖液能不能治好初发的白癜风
公益中国援助定点白癜风医院



转载请注明:http://www.bjgongshangzhuce.com/jygn/5571.html


当前时间: