获得人类基因组序列或许是现代最伟大的科学成就之一。对遍布于23个染色体上的30亿个核苷酸组成的这一复杂客体进行研究,毫无疑问充满了挑战。我们需要做的,就是将过去、当下及未来的信息整合起来,真正通晓人类基因的含义。
如果想要理解人类(基因组)数据,必须对以下几点有清晰的认识:
1.除了几千个仍需要填补的小洞以外,我们已经知晓了人类基因组的完整核苷酸序列。当然,这也是几乎要完成的新版本的人类基因组定期释放的原因所在,这种变化的状态对所有大型动物基因组都是真实的。
2.序列是由原始格式获取的,未来的挑战在于原始数据的注释,即创建有关人类基因组详细和精确特征的数据表格。
3.从整个世界范围来看,通过使用各种技术,关于人类基因和特征的信息每天都在产生。这需要某些乐于奉献的人将这些数据收集起来,认真地包装好,并免费向整个研究社区共享。
说完这几点认识,下面开始步入正题。要探索人类基因组,必然免不了要提到“Ensembl”。
Ensembl是什么?
ensumbl是脊椎动物基因组的基因组浏览器,支持有关比较基因组学、进化、序列变异和转录调节的研究,它能够对基因进行注释,计算多重比对,预测调节功能及收集疾病数据。打开