转录组分析如此简单基因结构挖掘及更新结

前几期基于百迈客云平台的所有基因、差异基因的数据挖掘,相信很多老师对于百迈客云平台在数据挖掘方面强大操作已经有所了解。前三期的讲解,基本上将老师们在转录组数据挖掘分析中常见的问题、常见的分析都给各位老师讲解了。本期小编将带领各位老师进行基因结构的数据挖掘以及结题报告更新。

首先是PCA分析,这个分析在很多文章中都比较常见,其表达的含义相对来说也比较简单。最常见的就是需要看重复样本是否很好的聚类到一起,组间样本有无明显的分开,同时分析有无超过置信区间的离群样本,这个也是剔除异常样本的依据。在PCA图中,如果样本之间聚集在一起,说明这些样本差异性小;反之样本之间距离越远,说明样本之间差异性越大。在云平台上做这个分析相对也比较简单,点击PCA分析后,SNP深度是SNP的reads支持数,合适的深度有利于筛选出可靠的SNP,必须为整数且在0~之间,默认为10。存在基因的比率默认即可。如果老师的样本不是太多,想在分析结果图中显示样本名称,在是否显示样品勾选即可。接下来进行样本分组,重复样本分成一组。分组完成后点击提交即可后台分析运行。

后台运行几分钟后,就可以得到常见的SCI论文中的PCA分析结果图。如下图。

系统进化树分析,一般这个分析主要适用于老师的样本属于不同的亚种或者品种,常见于比较转录组学的分析,老师研究的物种没有参考基因组,基于转录组水平上研究亚种或者品种间的进化关系。构树方法有贝叶斯法,邻接法,最大似然法。邻接法和最大似然法对应的样品数必须大于等于3,贝叶斯法样品数必须大于等于4。同一个群体,不同亚种层面的分析,推荐使用距离法;不同种或亲缘关系较远的材料,使用最大似然法;样本数较少,且对进化树精度要求很高的情况,推荐贝叶斯法。分析时间:距离法最大似然法贝叶斯法。其他SNP深度默认即可。

差异样本间SNP筛选,这个分析主要适用于样本间差异比较大的材料进行分析,对样品间同时检测到的碱基进行鉴定,筛选出差异SNP位点。老师可以基于此进行SNP标记的开发。当然,老师也可以针对目标基因或者染色体片段进行差异SNP位点的筛选。

在基因结构分析挖掘中,最常见的还是转录因子的预测分析。做完转录组测序分析之后,我们都会找到一些自己关心的差异表达基因进行转录因子预测,如果这些差异表达的基因中有转录因子,那么进一步还可以研究这些转录因子具体调控哪些基因的表达,即转录因子靶基因的预测。今天我们就给各位老师讲一下怎么在云平台上进行转录因子的预测。在云平台上进行转录因子预测相对比较简单,需要选择物种大类,动物or植物。选定好以后,需要老师们具体物种类型。如果老师研究的是模式物种,植物拟南芥、动物是人或者小鼠,就可以选择对应的模式物种即可,除此之外,建议都选择所有物种即可。然后提交即可对所有基因进行转录因子的预测,后期老师在所有结果里查找候选基因转录因子预测情况。

刚才讲到了转录因子的预测,预测完以后很多老师就要对转录因子的靶基因进行分析,要预测转录因子调控的靶基因,需要两个步骤:首先需要知道转录因子的结合序列特征;然后基于转录因子的结合序列特征去基因上游的promoter区搜索,如果能搜索到结合特征的序列,那么该转录因子就有可能调控该靶基因。这里小编给各位老师安利一个转录因子靶基因的预测网站,JASPAR(


转载请注明:http://www.bjgongshangzhuce.com/jygn/6490.html


当前时间: