自从CRISPR-CAS9出现以来,研究人员就知道这种基因编辑技术是很好的破坏者。准确地说,这些剪刀状的工具可以被发送到基因组中任何位置,剪断和破坏基因。但是,确切地说,CRISPR-CAS9将落脚在哪里以及如何破坏基因这些都是猜测。
到现在为止。布列根和妇女医院的调查人员与麻省理工学院博德研究所的同事合作,发现无模板的Cas9编辑是可预测的,他们已经开发了一种机器学习模型,可以高精度地预测插入和删除。该团队由共同通讯作者Richard Sherwood博士,David Liu博士和 David Gifford博士领导,已经证明,这种方法可用于编辑和修复与人类细胞系中的三种疾病——Hermansky-Pudlak综合征、MNKEs病和家族性高胆固醇血症——相关的突变,其中超过一半的病例具有可预测的修复结果。这些进步对研究和临床应用都有重要意义。该成果发表在Nature杂志上。(引起血液凝固缺乏和白化病的Hermansky Pudlak综合征,在波多黎各地区较为常见,MNKEs病导致铜缺乏。)
“像许多项目一样,这个结果令人困惑:我们想使用CRISPR-Cas9在基因组中的特定位点引起一组随机突变,但是我们发现我们获得的突变远非随机,” Brigham遗传学分部的主要研究者Sherwood说。“结果是,你指导CRISPR-Cas9的基础序列允许你以高度的精确度预测你最可能得到哪些突变。”
许多遗传病都是由插入和缺失引起的,这些插入和缺失会破坏基因的功能,因此能够复制这些基因或精确地修复这些基因将是一个重大的挑战。CRISPR-Cas9研究人员的传统观点认为,除非研究人员加入所谓的修复模板,否则该工具会随机产生基因中的插入和缺失。但Sherwood的团队发现,即使没有模板,人们也能预测哪些插入和删除最有可能发生。在某些基因组位点,一个特定的突变占主导地位——研究小组使用“精确-50(precise-50)”这个词来指代,某个单一突变占所有主要编辑产品的50%以上。
为了开展他们的项目,Sherwood和同事,包括Brigham遗传学部的首席研究员Christopher Cassa博士,构建了一个由2000个Cas9引导RNA(gRNA)和DNA靶位点配对的文库。他们使用这个库来训练一个机器学习模型。他们发现,inDelphi能够以高精度(r=0.87)预测5个人和小鼠细胞系的不同长度缺失和单碱基对插入,并且它预测高达11%的gRNA表现出“精确-50”效果。
为了证实这些发现,研究小组使用选择性的gRNA来纠正从患有遗传疾病的患者那里收集的细胞中的由微复制引起的突变,微复制是一种染色体改变,其中少量的遗传物质被复制。研究小组还生成了具有家族性高胆固醇血症(一种LDL胆固醇水平异常高的疾病)特征的微复制细胞。对于Hermansky Pudlak综合征、MNKEs和家族性高胆固醇血症这三种疾病,提供适当的CAS9和gRNA纠正突变的效率很高。
作者指出,这项工作仍然是一个概念证明:虽然在实验室细胞模型中有希望,但需要进一步测试和额外的步骤将其带入临床。此外,只有5和11%之间的CaS9引导RNA符合“精确-50”标准。Sherwood和团队现在将致力于通过理解为什么某些插入或删除比其他插入或删除更常见来优化引导RNA的效率。他们希望其他人能够利用他们开发的工具,为现有治疗应用的精确度制定监管标准,并扩大可能的应用。
“目前,大多数公司正在考虑CRISPR-Cas9的治疗应用,他们正在考虑你需要打破什么基因来治疗疾病。我们的研究结果表明,我们有可能预测我们可以在哪里修复突变。” Sherwood说,“我们不满足于50%的基因突变——我们希望继续改进。现在我们知道CRISPR-Cas9编辑是可预测的,我们有一个参数来测量如何更精确地修复疾病突变。”
{replyUser1} 回复 {replyUser2}:{content}