“人们对基因如何决定表型的认识不是一蹴而就产生的。年,DNA被证明是携带遗传信息的化学实体;年,DNA双螺旋结构被阐明;年,DNA碱基序列决定氨基酸序列,后者为蛋白质的构建提供信息的学说被确立;......”
1、DNA序列信息通过蛋白质决定表型
1.1蛋白质结构的多样性在最简单的转录过程中,一段基因能够转录产生同等长度的RNA分子,RNA分子合成后,其中的碱基序列被核糖体翻译成氨基酸序列。翻译得到的大分子可能包含成百甚至上千个氨基酸,并卷曲成独特的三维结构,形成有功能的蛋白质。
在真核生物中,RNA合成是一个复杂的过程。在转录为RNA分子的最初阶段,其长度与亲本基因的长度大致相等。然而,在延伸过程中,内含子被切除,其两侧的外显子连接在一起,导致转录后修饰的最终产物可能仅仅是hnRNA(最初合成的RNA分子及其在各个拼接阶段产生的衍生物共同构成hnRNA)的一个小小的片段,某些成熟mRNA的长度甚至不及其pre-mRNA(pre-mRNA通常指细胞质mRNA的前体hnRNA)的1%。
图2-1:前体mRNA的加工
值得重视的是,一条前体mRNA可能通过多种不同形式进行拼接,从而得到不同的成熟mRNA。这些选择性剪接形成的mRNA分子结合不同的外显子,发挥不同的生物学效应。实际上,人类基因组95%以上的基因产生的前体mRNA受选择性剪接的支配。有意思的是,可能存在一个特定的选择性剪接形式,当其产生的蛋白质在细胞中表达水平过高时,会使细胞由正常状态转换为癌细胞增殖状态。可以想象,某一调节剪接的蛋白质将介导细胞内许多甚至所有前体mRNA的剪接,而不是仅仅影响涉及特定细胞生物功能的基因子集。在细胞经历上皮-间质转化(EMT)过程中,多达个前体mRNA经历了选择性剪接,这些选择性剪接mRNA可能作为EMT的诊断标志物。
图2-2:一条前体mRNA经过选择性剪接形成不同的成熟mRNA
除了选择性剪接,翻译后修饰也是蛋白质多样性的重要原因。
蛋白质翻译后修饰的一种形式为某些化学基团与蛋白质链中特定的氨基酸残基共价结合,这些修饰分子主要包括磷酸基、糖基、甲基、乙酰基和脂基。如:大部分细胞表面蛋白的胞外区域和几乎所有的分泌蛋白都是糖基化的;又如:在肿瘤发展过程中发挥重要的作用的Ras家族蛋白定位于胞质,它包含可结合在羧基端的脂基。
另一种重要的翻译后修饰形式为蛋白酶对蛋白质的裂解作用,该酶具有在特定位点切断氨基酸链的能力,导致最终得到的成熟蛋白质比最初合成的短。很多蛋白质在合成后,被指派到胞内的特定位置,或被分泌至胞外,它们被分派的目的地由新合成的蛋白质的氨基酸序列决定。
综上,RNA转录后修饰和蛋白质翻译后修饰的复杂性,导致了细胞中蛋白质结构的多样性。
1.2蛋白质功能的多样性
蛋白质合成后,可通过多种途径构建表型:
它们可在细胞内汇集,构成细胞骨架,产生细胞的形态并使其能够运动;
图2-3:肌动蛋白(橘)与微管蛋白(绿)与细胞表面的突起有关
蛋白质是细胞外基质(ECM)的主要成分,后者能将细胞连接起来形成复杂的组织,ECM的结构常被恶性肿瘤破坏从而使肿瘤细胞能够迁移到正常情况下无法到达的位置;
图2-4:蛋白质在胞外组装为细胞外基质(ECM)
蛋白质还能收缩并且产生肌收缩和细胞运动,在肿瘤发展中细胞的运动性能帮助肿瘤细胞散布广泛;
图2-5:肌动蛋白构成细胞骨架并参与肌收缩
蛋白质的信号传递功能使复杂组织中各类的重要细胞保持适当的数量,这一点在肿瘤形成中极为重要,肿瘤细胞的异常生长大多由细胞内信号转导分子的异常引起;
很多蛋白质具有酶的功能,催化中间代谢过程中的数千个生化反应......
由此我们认识到,细胞和有机体的各方面表型可由蛋白质实现,蛋白质功能的多样性源于其结构的多样性。因此,用最简单的分子术语描述基因型与表型的关系即:表型由蛋白质实现,蛋白质的结构与功能由DNA碱基序列决定。(需注意:“表型由蛋白质决定”这一描述过于简单,它忽略了RNA分子的重要作用。具体内容待后续推送)
2、基因表达方式决定表型
动物体的所有细胞都是其受精卵的直系后代,这些细胞携带的基因组都是受精卵中基因组的精确拷贝,而动物体不同细胞的表型却具有极大的差异(如皮肤细胞与神经细胞)。经过长达3个世纪的探索,发育生物学家们最终发现,携带相同遗传模板的细胞获得不同表型的主要原因是:各类细胞对基因组的选择性表达。
随着早期胚胎中细胞不断地生长与分裂,位于胚胎中不同部位的细胞开始定型形成特定类型的组织而不是其他组织,这一过程称为分化。分化的细胞始终保持相同的基因组,但它们却聚集表现出不同的表型。
图2-6:基因表达微阵列的宏观分析:红色像素点表示某基因在某肿瘤中高于平均水平表达;绿色反之。
分化现象的出现是由于一些基因在某些细胞中有表达而在另一些细胞中没有表达,通过在一些特定的细胞中表达,一组基因编码合成一组特定的蛋白质和RNA分子,这些蛋白质与RNA最终协同创造出一种特定的细胞表型。因此,机体中每种分化细胞的表型在根本上可以理解为在该细胞类型中表达的特定基因的集合。
哺乳动物细胞中的基因按功能可分为管家基因和组织特异性基因。管家基因在机体所有细胞中共同表达,维持所有细胞的生存或所有细胞共同拥有的某种生物学功能;组织特异性基因仅在特异的细胞中表达,产生特异性的蛋白质,使细胞表现出特异性的分表型。在分化细胞中,绝大多数的表达基因都是管家基因,仅一小部分表达基因为组织特异性基因。例如:细胞表达-个管家基因,却表达少于个组织特异性基因。
有趣的是,在每种分化细胞中,基因组约2个基因中有相当一部分是未表达的,这主要是因为后者对于细胞的共性管家或特异分化目的并非必要的。
基因表达方式可以决定表型,那么基因表达受到哪些因素的调控呢?《癌生物学》学习分享下一期推送——基因表达的调控,我们不见不散!
参考书目:《TheBiologyofCancer》(SecondEdition)R.A.Weinberg著,詹启敏等译编辑:周健张月明游丹铭
校审:张健罗鹏