iNature
作为一种开创新的科研工具,这一被称为“魔剪”的基因编辑工具在基因治疗应用方面也被寄予厚望。但是,困扰其它定向核酸酶的老问题——脱靶效应,也同样影响着CRISPR系统。研究发现CRISPR会带来大量的非靶序列的SNVs和InDels,这些突变涉及了基因组的编码区和非编码区。重要基因的关键碱基突变有可能会直接影响机体的生理功能,如果CRISPR系统引入非靶序列的大量突变,这将大大影响对CRISPR的临床应用。在临床转化中,使用准确寻找脱靶位点的方法有重要意义。目前,主要是通过计算机模拟预测sgRNA脱靶位点,但是实际中会发生预测的脱靶位置并未发生基因突变,而未预测到的脱靶位点却发生了大量突变,说明目前预测的脱靶的算法存在一定的局限性。
年5月21日,NatureMethods又以BriefCommunication形式再度刊文,对CRISPR技术在编辑后的大鼠和小鼠体内的脱靶效应进行全面的分析。研究人员对预测的脱靶方法,进行了改进,并以基因编辑的大鼠和小鼠为案例,通过改良的预测的脱靶方法以及评估手段,对CRISPR脱靶效应进行了全面而细致的分析。
尽管CRISPR得到了广泛的应用,但是关于Cas9介导的在基因编辑的啮齿动物中的效率和脱靶效应的数据的了解是有限的。在这里,研究人员报告了81个小鼠和大鼠基因组编辑,在个预测的非目标位点上的深度测序数据,其中32个被证实,并表明高保真Cas9版本降低了体内的非目标突变率。研究人员利用10个小鼠胚胎的全基因组测序数据,用SgRNA处理,以及从他们的遗传父母那里,研究人员发现了43个非靶点,其中30个由改编版本的GUIDE-seq预测。
一些研究已经分析了细胞系中的CRISPR脱靶,并且可以使用许多现有方法以无偏方式生成脱靶列表:高通量全基因组易位测序,GUIDE-seq(全基因组)Digenome-seq(体外Cas9消化的全基因组测序),BLESS(标记双链断裂,然后进行富集和测序),以及最近的SITE-seq(识别DNA切割位点的生物化学方法)和CIRCLE-seq(用于识别脱靶突变的体外方法)。据研究,这些方法目前并不用于在啮齿动物模型生成之前测试sgRNA。相反,啮齿动物基因组编辑中脱靶风险的分析依赖于CRISPR设计算法。
产生基因组编辑的小鼠和大鼠的大多数设施都遵循最小限度的指导方针来限制脱靶效应。虽然这样的指导是有用的,但即使是最优化的sgRNA也具有潜在脱靶目标的预测列表,只有当所得到的动物经受实验测试时这才是有价值的。由于对长程增强子和其他调控元件的理解有限,注释基因之外的潜在脱靶点不能被忽视。CRISPR用于基因组编辑的主要优势包括可以生成具有新突变的动物模型的速度,并且期望避免需要与一代以上的原始菌株回交。此外,敲入项目的成功取决于初始双链断裂与靶位点的接近程度,因此在某些情况下,有必要对sgRNA特异性进行折中。
图1概述了研究人员用于啮齿动物基因组编辑项目的CRISPR工作流程。先前描述了一种类似的测序方法,但该报告仅提供了来自5个sgRNA和56个潜在脱靶的数据,未发现脱靶突变。除了识别可能会被遗漏的低频偏离目标外,mosaicG0而不是他们的G1子代的深度测序分析也允许选择具有高期望值的候选等位基因更有效的育种。
利用CRISPR项目确定的脱靶目标以及利用重新设计的Cas9体内降低脱靶频率
研究的动物模型项目中有23%(19/81)偏离了目标,定义为至少一种具有至少一个带有Cas9等位基因的动物在超过3%的序列中读取至少一个被分析的非目标位点。例如,一些动物模型项目需要使用两个sgRNAs来产生一个大的敲除缺失。被调查的sgRNA中有18%具有非靶点活性,其中8例在一次以上预测的非目标状态下具有活性。CRISPR-Cas9活性在2%预测的非靶基因座上检测到,其序列信息丰富。56%的非目标位点位于已知基因的内含子或保守定义的启动子/非翻译区(上游或下游)。21个非目标阳性sgRNAs的摘要和在本研究中分析的所有sgRNAs和预测的非目标sgRNAs的完整列表载于补充图。
补充图4提供了32个已识别的非目标的概述,图1C-f和补充图5显示了ON和非目标突变频率的分布。补充图提供了来自非目标阳性sgRNAs的所有G0founders等位基因频率的细分。6和7及补充表2。在五个项目中,培育了具有非目标等位基因的G0founders,并为传递以下数据提供了数据:从这些创建者到他们的G1后代的非目标等位基因在补充图6中提供。研究数据表明,即使是非目标等位基因约10%的读取可以传递给下一代。基因组比对的例子见补充图8。大多数由Cas9引起的插入/缺失突变都很小,可以通过我们的分析来确定。因此,除了缺乏序列数据的个预测的非目标位点外,在本研究中不太可能错过预测的和排名最高的非目标阳性位点。
导致非目标活性的sgRNAs并不比没有这种活性的sgRNAs更活跃(补充图9A)。研究人员没有观察到MIT特异性评分(sgRNAs的综合质量评分)与非目标命中动物的比例之间有很强的相关性(R2=0.;补充图9B)。尽管如此,研究的数据表明,与以前的观察结果一致9,特异性评分为66分。识别的比数比当≥评分为66(P=0.)时,无非靶突变的sgRNA为18(补充注释2)。虽然识别出的非目标在15个预测的目标中排名较高(补充图9C),但有几个排序较低,这表明,如果只对前15个预测的基因组位点进行分析,可能会错过真正的偏离目标的目标。
TEG-seq是体内活性的良好预测指标
研究使用两种被发现有非靶点的sgRNA(小鼠pnpla3和大鼠map3k14),比较了小鼠和大鼠胚胎(图1g,h)和细胞株(补充图10)中的cas9基因工程变体,并将其与野生型Cas9基因进行了比较。Cas9变异体eSpca9(1.1)和SpCas9-HF1与野生型Cas9相比,都降低了离目标突变频率。对于Pnpla3胚胎,我们没有观察到变异体在目标上的效率降低(图1g)。细胞中SpCas9-HF1活性略高于野生型Cas9(补充图10A)。在map3k14中,工程菌Cas9的目标效率比野生型Cas9活性(图1H,补充图10b)变化更大,也更低,与其他研究结果一致(补充说明3)。研究人员建议将eSpca9(1.1)14和SpCas9-HF或其他工程的Cas9变体(例如HypaCas)考虑用于动物模型的常规生成,特别是在目标效率较低的项目中。
因为研究人员观察到在预测的前15位中的4个目标为小鼠PNPLA3SGRNA,并且因为特异性得分非常低(26.4),接下来使用无偏的方法来识别这个SGRNA的所有真正偏离目标,这使得能够更精确地测试现有预测值。算法。使用小鼠细胞系,研究人员首先进行靶向富集导向SEQ(TEGSEQ),一种适合于离子激流测序平台(方法)的GUDE-SEQ2的变体,并鉴定了个DNA标签插入位点。扩增子的深度测序分析(AppleSeaSeq)证实的位点为OFF靶标(补充表3)。如补充图11,63所示,个AppleSeSeq验证过的目标与我们的个CRISPORT预测的9个目标重叠,最多有五个错配。四十二个偏离目标在六和八个错配之间,并且对于一些,需要适当的对准的基对的凸起17(补充表3)。
GUIDE-seq分析如何预测体内产生的脱靶目前尚不清楚。因此,研究人员进行体外受精并将Pnpla3sgRNA和Cas9mRNA微注射到来自C57BL/6J小鼠的合子中,随后对10个胚胎及其遗传亲本进行全基因组测序,平均覆盖率为80%(方法)。过滤包括减去遗传亲本中发现的所有变异,并且鉴定了43个真正的Cas9产生的脱靶(补充图12和补充表3)。补充图13提供了Pnpla3脱靶基因组比对的实例,并且所有43可以从UCSC基因组浏览器(方法)上的数据轨道中心查看。43个关闭目标中有30个与已验证的TEG-seq命中重叠,其中25个与预测的目标重叠(补充图11和补充注释4)
图2A和补充图显示了43枚离靶胚胎在所有10个胚胎中的分布情况。14和15a.观察到,与平均胚胎突变频率(图2B)有很强的相关性(R2=0.85,P0.)。TEG-seq阅读数与胚胎平均突变频率的相关性较弱(R2=0.58,P0.;补充图15B),与MIT7无显著相关性(R2=0.30,P0.05)。切割频率测定(Cfd)=0.(R2=0.38,P0.),离靶得分(补充图15C,d)。
为了计算MagiSeq在体内预测真正的离体目标的能力,研究人员选择了平均突变频率至少为10%的离体目标,因为低频率的等位基因不太可能传递给下一代(补充图6)。图2c显示了每个胚胎≥10%频率的离靶数;注意到只有15/43的离体目标的平均频率大于10%。在至少两个胚胎中观察到了所有15个离靶的情况。在15个目标中,1个有6个不匹配,2个有5个不匹配,剩下的12人有一到四次不匹配。补充图15e显示了在给定的放大器突变频率截止时捕获的15个离目标的部分。在2.5%的放大器截止后,15个目标中有14个将被识别(93%).非目标21(补充表3)是由TEG-seq确定的,但后来未得到放大器的证实。通过比较,在这15次点击中,需要从0.1(1,个位点;MIT)或0.2(个位点;CFD)的目标分数截断算法(分别为73%和93%)(补充图15F、g和补充说明5)。
虽然pnpla3sgRNA产生了大量的非目标突变,但它可能是最坏的情况(补充说明6)。使用比分数较高的sgRNAs和/或具有更高保真度的Cas9应该可以降低离目标的风险和影响。然而,为了完全避免意外的表型,研究人员也建议用无偏的方法来预测非目标,然后对G0founder动物进行放样筛选。
原文链接: