生物极客按: 有效的gRNA设计工具,对我们进行基因编辑有着重要的意义,来自哈佛大学的GM Church课题组在Acs Synthetic Biology上,开发的SgRNA Score2.0,可以用于包括SaCas9等多种sgRNA的预测,方便人们更好的利用基因组编辑工具。
论文解读:
目前已经有多个课题组评估了数百到数千个sgRNA的相关的序列特征并且已经创建了公开的可用软件来帮助研究人员进行sgRNA选择。来自GM church课题组开发的sgRNA Scorer 1.0自2015年7月发布以来,共有超过7000个独立用户,87个不同的国家的研究人员进行使用。
然而随着CRISPR领域的不断深入,科学家们从其他细菌物种中鉴定CRISPR系统,同时也开发了相应的真核细胞编辑的能力.然而,如果一个一个不同的cas9进行验证相应的工作量非常的庞大。因为目前的策略需要需要为每个要分析的CRISPR蛋白产生和测试sgRNA序列文库。因此,科学家们开发新的工具试图预测多种CRISPR蛋白质中的sgRNA活性。
科学家们构建了支持向量机(SVM)模型,用来评价其他三个Cas9同源物和一个非Cas9系统----Cpf1的预测能力。
首先科学家们合并了SpCas9(133高,146低)和St1Cas9(82高69低)的高活性和低活性sgRNA序列,产生215个高活性和215种低活性sgRNAs 。随后,将这430个sgRNA序列用作新的SVM的基础。我们的新模型的10倍交叉验证产生了73.7%的精度,72.8%的精度和75.8%的回收率,这与以前的SpCas9和St1Cas9的各个型号相当。科学家们评估新模型预测SpCas9和St1Cas9的sgRNA活性的能力。使用以前生成的靶基因座测序的预测数据,我们重新计算了这些sgRNA,发现我们的新旧模型之间的预测分数与SpCas9的相关性为0.997,St1Cas9的相关性为0.940,表明将来自两种不同的Cas9直向同源物对每个Cas9的预测能力没有不利影响。
1.科学家们大胆推测不同crispr系统之间sgRNA活性的相关性,从而极大的拓展了使用。
2.科学家们使用SVM支持向量机,从而识别活性背后潜在的规律。方便更好的预测。