提示:点击↑上方蓝字免费订阅!
导读:TALEN、ZFN和CRISPR/Cas是基因组编辑三大技术,本文对这三种技术的原理、缺陷、未来发展趋势,及其在遗传学研究领域的作用和潜在的医学应用前景做了详细介绍和对比。
转录激活样效应因子核酸酶(transcriptionactivator-likeeffectornuclease,TALEN)技术与锌指核酸酶(Zinc-fingernuclease,ZFN)技术组成了一大类强有力的基因组编辑工具,这一大类技术的发展重新划定了生物学研究的边界。这些嵌合核酸酶由两部分组成——一个可编码的序列特异性DNA结合模块与一个非特异性的DNA切割结构域。通过诱导DNA双链断裂(DNAdouble-strandbreak)来刺激容易出错的非同源末端连接或在特定基因所在的位置进行的同源定向修复,TALEN和ZFN能够完成一系列遗传学编辑修饰操作。
成簇规律间隔短回文重复(clusteredregulatoryinterspacedshortpalindromicrepeat,CRISPR)技术是最新出现的一种基因组编辑工具,它能够完成RNA导向的DNA识别及编辑。与其它基因组编辑工具相比,CRISPR技术更易于操作,具有更强的可扩展性。
本文将以上述三种技术为例,介绍并探讨新一代位点特异性基因组工程技术的生物学原理、未来发展趋势,及其在遗传学研究领域的作用和潜在的医学应用前景。
一、TALEN技术
TAL效应因子(TALeffector,TALE)最初是在一种名为黄单胞菌(Xanthomonassp.)的植物病原体中作为一种细菌感染植物的侵袭策略而被发现的。这些TALE通过细菌III类分泌系统(bacterialtypeIIIsecretionsystem)被注入植物细胞中,通过靶定效应因子特异性的基因启动子来调节转录,来促进细菌的集落形成。由于TALE具有序列特异性结合能力,研究者通过将FokI核酸酶与一段人造TALE连接起来,形成了一类具有特异性基因组编辑功能的强大工具,即TALEN。
近年来,TALEN已广泛应用于酵母、动植物细胞等细胞水平基因组改造,以及拟南芥、果蝇、斑马鱼及小鼠等各类模式研究系统。年《自然?方法》(NatureMethods)将其列为年度技术,而年的《科学》(Science)则将TALEN技术列入了年度十大科技突破,针对该文的评论更是给予它基因组的巡航导弹技术的美誉。
1.TALEN结构及技术原理
1.1TALEN的典型结构
如前文所述,典型的TALEN由一个包含核定位信号(Nuclearlocalizationsignal,NLS)的N端结构域、一个包含可识别特定DNA序列的典型串联TALE重复序列的中央结构域,以及一个具有FokI核酸内切酶功能的C端结构域组成。不同类型的TALEN元件识别的特异性DNA序列长度有很大区别。一般来说,天然的TALEN元件识别的特异性DNA序列长度一般为17-18bp;而人工TALEN元件识别的特异性DNA序列长度则一般为14-20bp。
图1TALEN的结构。(A)与靶点DNA(灰色显示,PDBID:3UGM)结合的TALE蛋白。每一个独立的TALE重复序列元件包含33到35个氨基酸残基,这些TALE重复序列元件能够通过两个高变异度的残基(即重复可变双残基,RVD,棍状显示)来识别一个单一的碱基对。(B)TALE核酸酶(TALEN)形成二聚体结合DNA的动画演示。TALEN目标位点由两个TALE结合位点组成,这两个位点间通过不同长度的间隔区序列(12-20bp)分开。TALE可以被设计成仅仅识别左半侧位点或右半侧位点。图片来源:ThomasGaj,CharlesA.Gersbach,andCarlosF.BarbasIII.()ZFN,TALEN,andCRISPR/Cas-basedmethodsforgenomeengineering.TrendsinBiotechnology,31(7):-.
1.2TALEN技术的原理与步骤
TALEN技术的原理并不复杂,即通过DNA识别模块将TALEN元件靶向特异性的DNA位点并结合,然后在FokI核酸酶的作用下完成特定位点的剪切,并借助于细胞内固有的同源定向修复(HDR)或非同源末端连接途径(NHEJ)修复过程完成特定序列的插入(或倒置)、删失及基因融合(图2)。
图2TALEN进行基因组编辑的原理。利用位点特异性核酸酶可以进行基因组编辑,而核酸酶诱导的DNA双链断裂(DSB)可由同源定向修复(HDR)或非同源末端连接途径(NHEJ)来修复。(A)在供体质粒(donorplasmid)暴露出延长的同源臂(homologyarm)的情况下,HDR可能导致插入的单个或多个转基因发生改变或取代原有的基因。(B)在缺失供体质粒的情况下,NHEJ介导的修复会产生小的插入或删失突变,并可能导致目标基因被破坏;在有双链寡核苷酸或线状供体质粒存在的情况下,这些DNA片段可能通过NHEJ介导的连接反应插入;同时诱导两个DSB的产生则会引起删失、插入和易位突变。图片来源:ThomasGaj,CharlesA.Gersbach,andCarlosF.BarbasIII.()ZFN,TALEN,andCRISPR/Cas-basedmethodsforgenomeengineering.TrendsinBiotechnology,31(7):-.
TALEN技术的核心原理就是在同一个蛋白(TALEN)上有序地实现引导进入细胞核、靶位点DNA的特异性识别和靶位点DNA的切割这三个不同的功能,这一点在上述TALEN典型结构一节中已作了较为详细的描述。在具体操作中,例如在实验室条件下,实现TALEN的关键就在于完成DNA的特异性识别功能,一般说来分为两个步骤。图3与图4分别以“铂金门”TALEN构建系统(PlatinumGateTALENconstructionsystem)和商业化的easyT体系为例,展示了实验操作中TALEN元件的构建。
图3“铂金门”TALEN构建系统TALEN元件构建操作示意图。步骤一,四个或更少的组件被连接到阵列质粒(arrayplasmid)上;步骤二,构建好的阵列随后被连接到哺乳动物表达载体中;白色和粉色的长方形分别表示在BsaI和Esp3I限制性内切酶切割后留下的粘性末端;蓝色字母代表RVD,红色字母代表non-RVD变化,黄色长方形代表后一半重复。图片来源:TetsushiSakuma,HiroshiOchiai,TakehitoKaneko,TomojiMashimo,DaisukeTokumasu,etal.()Repeatingpatternofnon-RVDvariationsinDNA-bindingmodulesenhancesTALENactivity.ScienceReport,3():1-8.
图4“easyT”TALEN构建系统TALEN元件构建操作示意图。(A)包含一个长度为18.5个组件的TALE重复元件的TALEN体系示意图。该TALE重复元件由20个单体单位(monomerunit)组装而成。单体单位的边界在组装过程中发生了移位。(B)TALEN克隆示意图。第一步,由四个单体通过连接反应组装成4聚体;第二步,4聚体(4-mers)进行PCR扩增,琼脂糖凝胶电泳,胶回收并浓缩;最后,在第二次连接反应中,4聚体被组装到TALEN骨架质粒(backboneplasmid)上;黄色和蓝色箭头分别表示4聚体扩增时的正向引物与反向引物。图片来源:TomonoriKatsuyama,ArslanAkmammedov,MakikoSeimiya,SamuelC.Hess,CemSieversandRenatoPar.()Anef?cientstrategyforTALEN-mediatedgenomeengineeringinDrosophila.NucleicAcidsResearch,41(17):e-.
1.2.1构建TAL靶点识别模块
TAL的DNA特异性识别单位是间隔32个恒定氨基酸残基的二联氨基酸。二联氨基酸与AGCT这4个核苷酸碱基有一一对应的关系:腺嘌呤(A)由NI识别、胸腺嘧啶(T)由NG识别、鸟嘌呤(G)由NN识别,而胞嘧啶(C)则由HD识别。实验操作中,我们通过靶位点的DNA序列可以反推能特异性识别这一序列的二联氨基酸序列,从而构建TAL靶点识别模块。
1.2.2TAL靶点识别模块的克隆与表达
根据之前对TALEN结构的介绍,我们需要将上一步骤中根据目标DNA序列构建好的一对TAL靶点识别模块与N端的核定位序列、C端的FokI酶连接起来,才能得到一个完整的TALEN元件。一般来说,我们可以采用专门用于构建TALEN的真核表达载体体系,将一对特异性的TAL靶点识别模块克隆进该载体中,再通过转染等方式导入细胞内。这种体系一般由供体质粒(donorplasmid,提供单基、二联及三联等类型的TAL模块)和骨架质粒(backboneplasmid,用于构建TALEN并表达构建好的TALEN)两类质粒构成,常用的TALEN体系有RCIscript-GoldyTALEN和pC-GoldyTALEN、TAL5-BB和pTAL6-BB及pCS2TAL3-DD和pCS2TALE-RR等。
2.TALEN技术的应用及近期发展
虽然TALEN技术的基本原理并不难理解,但其发现过程却较为曲折。从年首次发现TAL起,研究者前后历时近21年才研究清楚TAL的工作原理。自年正式发明TALEN技术以来,全球范围内多个研究小组利用体外培养细胞、酵母、拟南芥、水稻、果蝇及斑马鱼等多个动植物体系验证了TALEN的特异性切割活性。
2.1TALEN技术的应用
年北京大学(PekingUniversity)的Zhang等人首次使用TALEN技术在斑马鱼中成功实现了定向突变和基因编辑;而爱荷华州立大学(IowaStateUniversity)的Wang等人则在年,也以斑马鱼为模式动物,并首次使用TALEN技术在活体内完成了特定DNA的删除、人工DNA插入等较为复杂的操作。随后TALEN技术在植物、大小鼠的基因组改造等方面的应用也顺利完成。而年Zhang使用TALEN诱导了DNA双链断裂,提高同源定向修复效率,在斑马鱼中实现了同源重组基因打靶。
2.2TALEN的近期发展
如前所述,经典的TALEN体系已经广泛应用,越来越多的实验室以及实验外包公司均能很好地完成TALEN相关实验,但是基本限于单基因的插入或敲除操作,而且主要用于单个基因功能的研究。年,首尔国立大学化学系和国家基因工程创新举措研究中心的Kim课题组建立了一个全基因组规模(genome-scalecollection)的TALEN体系,他们系统地选取了人类基因组中高度特异性的序列作为靶位点以避开脱靶(off-target)效应,通过一种高通量克隆体系,一次性构建了18,个编码蛋白的基因的TALEN质粒。
在这项研究中,研究者以一种巧妙的方式优化了TALEN质粒的结构,以检测插入靶位点后质粒对应位置上EGFP的表达的方式检测了TALEN靶位点插入成功率(图5a)。通过这一方式,他们可以研究不同间隔序列下特定靶位点插入效率(图5bc),从而针对每一个靶位点,都能选出最佳的TALEN体系结构。年2月,北京大学生命科学学院魏文胜课题组依托于一种自主研发的TALE蛋白组装技术(ULtiMATEsystem)完成了全部TALE元件的解码工作。
近年来,随着TALEN技术逐渐成熟,全球范围内各实验室已广泛使用TALEN技术来完成基因打靶操作。TALEN通过与显微注跨越干细胞研究、基因治疗、神经网络,以及射、慢病毒感染等技术手段相结合,其应用范动植物育种等多个领域,强力推动生命科学的围越来越广。相信在不远的将来,其应用必将进步。
图5TALEN元件的优化。(a)基于RFP-GFP报告基因的各TALEN元件基因编辑活动的检测方法图示,只有插入靶位点后才能修正紧随其后EGFP的读码框以表达EGFP;(b)TALEN靶点和TAL效应子与FokI结构域融合连接区域的氨基酸序列;(c)TALEN基因编辑活力的比较。报告基因质粒包含靶位点,靶位点中有各类间隔序列(彩色标记),将报告基因质粒和TALEN质粒共转染到HEK细胞中,然后使用流式细胞术分离GFP阳性的细胞。图片来源:YongsubKim,JiyeonKweon,AnnieKim,JaeKyungChon,JiYeonYoo,HyeJooKim1,SojungKimetal.()AlibraryofTALeffectornucleasesspanningthehumangenome.NatureBiotechnology,31(3):-.
二、ZFN技术
锌指核酸酶(Zinc-fingernuclease,ZFN)又名锌指蛋白核酸酶(ZFPN),它是一类人工合成的限制性内切酶,由锌指DNA结合域(zincfingerDNA-bindingdomain)与限制性内切酶的DNA切割域(DNAcleavagedomain)融合而成。研究者可以通过加工改造ZFN的锌指DNA结合域,靶向定位于不同的DNA序列,从而使得ZFN可以结合复杂基因组中的目的序列,并由DNA切割域进行特异性切割。此外,通过将锌指核酸酶技术和胞内DNA修复机制结合起来,研究者还可以自如地在生物体内对基因组进行编辑。目前,在大量植物、果蝇、斑马鱼、蛙、大/小鼠及牛等物种中,ZFN技术已被广泛应用于靶向基因的突变,通过人工修改基因组信息可以产生遗传背景被修改的新物种。该技术在医学领域也具有非常重大的价值,对于疾病的基因治疗有潜在意义,具有非常广泛的应用前景。
1.ZFN结构及基本技术原理
1.1ZFN的结构
顾名思义,ZFN由负责特异性识别序列的锌指DNA结合域和进行非特异性限制性内切酶切割的DNA切割域两部分组成(图6)。其中锌指DNA结合域部分一般包含3个独立的锌指(Zincfinger,ZF)重复结构,每个锌指结构能够识别3个碱基,因而一个锌指DNA结合域可以识别9bp长度的特异性序列(而ZFN二聚体,则包含6个锌指,可以识别18bp长度的特异性序列)。目前最常用的ZF结构为Cys2His2锌指,其结构由大约30个氨基酸包裹一个锌原子构成。研究表明,增加锌指的数量可以扩大ZFN特异性识别DNA序列的长度,从而获得更强的序列特异性。具体操作中,则一般通过模块化组合单个ZF,来获得特异性识别足够长的DNA序列的锌指DNA结合域。ZFN的三维空间结构如图6所示。
图6ZFN的结构。该图为DNA双链与一对ZFN结合的示意图。每一对锌指用粉色标出,图像左侧的锌指用带状结构表示,右侧的锌指用填充空间结构表示;FokI的DNA切割域如蓝色区域所示;位于连接域与切割域之间的长度为四个氨基酸的“连接区”(linker)如灰色填充空间结构所示。DNA双链的糖-磷酸骨架为橙色,碱基显示为蓝色,在ZF结合位点两侧的DNA区域间距为6bp。该示意图由Smith等人在年根据锌指蛋白与DNA结合的晶体结构数据所编译而来。图片来源:CarrollD.()Genomeengineeringwithzinc-fingernucleases.Genetics.(4):-82.
此外,如果锌指DNA结合域与目的DNA序列能够完美配对,即便只含3个ZF结构的ZFN也能在基因组中特异性地结合18bp长度的序列。通过研究者长期的努力,识别每一种三联碱基的64种锌指组合中已有大部分被发现并编撰成目录,这些相关数据也都能够在公共的数据库或者文献中被检索到。针对每一条需要识别的目标序列,我们都可以使用与密码子对应的类似方式对锌指结构进行模块化组装(modularassembly),从而获得能够识别特定DNA序列的锌指蛋白结构。
ZFN的切割域与DNA结合域通过连接区(linker)结合。在ZFN中应用最广泛的DNA切割域来自IIS型限制性内切酶FokI。由于切割域与DNA链的结合能力较弱,因此DNA切割域必须以二聚体的形式发挥作用。构建锌指核酸酶时,应针对DNA各链上的邻近区域设计两条ZFN,使其DNA切割域能够位于双链的同一位置,以达到最佳的切割效果。两条ZFN之间具有被称为“间隔区”的spacer结构,该结构的长度以5~6bp为宜,7bp也能正常工作,合理的“间隔区”设计才能保证ZFN二聚体拥有最佳的工作空间(图7)。
图7ZFN特异性识别DNA并与DNA结合示意图。每个DNA识别域包含三个锌指,锌指从N端开始命名,在图中标示为F1、F2、F3。每个锌指结构分别与3个碱基发生直接接触,由此产生特异性。单独的FokI切割域不具有特异性识别能力,但当与锌指结构相连,并与另一个FokI切割域形成二聚体后,便能够对DNA双链进行切割。两个切割位点之间的距离约为4bp,如箭头所示。图片来源:CarrollD.()Genomeengineeringwithzinc-fingernucleases.Genetics.(4):-82.
1.2ZFN技术的初步应用及其机制
ZFN技术可用于基因组编辑。针对目的基因序列设计并合成ZFN后,使之对DNA进行特异性切割,从而形成DNA双链断裂区(Double-StrandedBreaks,DSB);通过破坏非同源末端链接(non-homologousendjoining,NHEJ)使目的基因失活,或借助同源重组(homologousre北京白癜风的最好医院中科白癜风医院喜迎国庆