科技前沿
新工具可预测将基因编辑的DNA序列成功插入基因组的几率
2023-06-21 09:26  点击:38
  英国Wellcome Sanger研究院和爱沙尼亚塔尔图大学的研究人员近日在Nature Biotechnology杂志上发文称,他们开发出一种新工具,可预测将基因编辑的DNA序列成功插入基因组的几率。
 
  在这项研究中,研究人员试图系统地评估插入序列的长度和组成、细胞系、目标位点以及不同版本的主编辑器如何影响插入效率。
 
  为此,他们总共构建了3604 个pegRNA,编码长度从1 nt 到69 nt 不等且GC 含量不同的预切口插入片段。他们将序列插入两个细胞系(HEK293T 和HAP1 细胞),靶向四个目标位点(HEK3、EMX1、FANCF 和CLYBL)。一周后,他们对细胞的基因组进行了测序,以确保编辑成功。
 
  由于插入速度相差三个数量级,研究人员试图从插入长度开始了解相关特征。他们在HEK293T细胞中发现了两个特点:3和4核苷酸序列的插入速度比其他序列快; 15-21个核苷酸的序列插入率高于周围序列。然而,在HAP1 细胞中,1-4 b.p. 的短序列插入率。不高于较长序列。他们将此归因于错配修复(MMR) 系统,因为HEK293T 细胞部分缺乏MMR。这在MLH1 错配修复基因被敲除的HAP1 细胞中也得到了证明,表明MMR 系统可以阻止短序列的插入。
 
  之后,他们分析了初级编辑的各个阶段如何影响插入序列的速度。他们发现,如果pegRNA 包含四个或更多连续的腺嘌呤,插入率会显着降低。此外,另一个重要的引物编辑步骤是实现具有5'-翻转(包含野生型序列)和3'-翻转(包含插入)的中间体之间的平衡,而5'-翻转核酸酶FEN1 和3 ' -翻转核酸酶FEN1。 TREX1 和TREX2 核酸酶提供了这种平衡。他们发现3'-flap 核酸酶TREX1 和TREX2 抑制了较长序列的插入。
 
  同时,插入序列的核苷酸组成和二级结构也会影响插入率。研究人员发现,主要的编辑系统明显偏爱胞嘧啶。插入序列中胞嘧啶每增加1%,插入率平均增加2.2%。相反,腺嘌呤和胸腺嘧啶的百分比降低了每个位点的插入率。此外,他们发现可以更有效地插入具有更高结构强度的序列。
 
  为此,他们使用了Twist Bioscience 提供的寡核苷酸库。据Twist介绍,他们独特的硅基DNA合成平台可以在一次运行中生成超过一百万个寡核苷酸,数量几乎没有限制,而且寡核苷酸池准确且均匀,让人们对实验结果充满信心。 信心。此外,实验中使用的几种载体和基因片段也由Twist Bioscience提供。
 
  了解了影响插入率的许多因素后,研究人员希望预测在同一位置插入不同序列的效率。他们应用机器学习方法并选择了10 个特征来训练数据,包括插入序列的长度、组成、pegRNA 二级结构和MMR。这种称为MinsePIE 的方法能够很好地预测测试数据插入性能,相关性达到0.68(图2)。
 
  在对现有数据进行训练后,他们在新数据上测试了MinsePIE 模型,发现它能够准确预测多个插入序列的成功概率。随后,他们还通过实验测试了预测的序列。与预测较低插入率的密码子变体相比,预测较高插入率的密码子变体确实表现出更高的插入率,这凸显了MinsePIE 模型在密码子优化方面的强大功能。研究人员认为,这种计算模型可以帮助人们选择最有效的序列写入他们的基因组。
 
  最后,研究人员就如何提高主编辑系统的插入效率提出了几点建议。他们建议选择胞嘧啶含量高且易于形成二级结构的序列。对于使用U6 启动子的pegRNA,尽量避免插入腺嘌呤。对于少于14 个核苷酸的序列,瞬时MMR 抑制或MLH1 敲除将大大提高插入效率。总的来说,这项工作扩展了我们对短序列插入效率的理解,并展望了复杂的基因组工程和纠正各种致病突变的前景。
发表评论
0评
推荐阅读