从读到写
基因是生命的语言,在过去几十年里,基因组测序和合成的过程,就是一部生命语言的发展史。在日前的”尹哥的深夜课堂“里,华大基因CEO尹烨博士以《基因传:从读到写》为题,和我们分享了这部磅礴辽远的发展史。
一、生命语言的读
和人类的传统语言认知一样,人类对生命语言的掌握也是从最初的“读”开始。
Sanger测序初露端倪
年,美国康奈尔大学的生化学家罗伯特·霍利(RobertHolley)采用类似蛋白质测序“化整为零”的方法,耗时7年(3年分离RNA,4年测序)测定了一条只有77个碱基的酵母转运RNA序列。这算得上第一个被测定序列的核酸分子。而他也在年与尼伦伯格、获拉纳一起分享了当年的诺贝尔生理学或医学奖。
年,弗雷德里克·桑格(FrederickSanger)用双脱氧法测定了噬菌体φX的基因组序列,长度为个碱基,这是人类第一次测定一个生物体完整的基因组。但事实上这是指第一个DNA的基因组测定,第一个RNA的基因组测定其实是噬菌体MS2,由比利时根特大学的瓦尔特·菲尔斯(WalterFiers)在年鉴定并公布,比前者早一年。也正是基于桑格的第一个DNA噬菌体测序,估算一个碱基的测序成本约为10美金,这就是最早人类基因组计划预估亿美金的由来。
年,桑格与沃尔特·吉尔伯特(WalterGilbert)和保罗﹒伯格(PaulBerg)一起分享了诺贝尔化学奖,成为历史上唯一一位两次荣获诺贝尔化学奖的科学家。
利用Sanger双脱氧终止法的测序原理,结合荧光标记和毛细管阵列电泳技术来实现测序的自动化,很多物种的基因组破译得以实现。Sanger测序技术的优点是测序读长长,能达到-1Kbp,且用时短,只需要几十分钟即可完成一次测序,准确度高达99.%,目前仍是测序的金标准;年完成的首个人类基因组图谱就是以改进了的Sanger法为其测序基础。缺点是通量低、成本高,影响了其真正大规模的应用。
此后,第一个测序的模式植物拟南芥于年完成。重要的粮食作物水稻基因组于年完成,第一个测序的家禽家鸡基因组于年完成,高重复玉米基因组于年完成,这几个项目华大都深度参与了。
滑动