作者:by Jackson Laboratory
杰克森实验室(JAX)、麻省理工学院和哈佛大学Broad研究所以及耶鲁大学的研究人员利用人工智能设计了数千种新的DNA开关,这些开关可以精确控制不同细胞类型中基因的表达。他们的新方法开启了在人体内以前从未实现过的可能性,即以有利于人类健康和医学研究的方式控制基因何时何地被表达。
瑞安·特威希博士(Ryan Tewhey)说道:“这些合成设计的元素的独特之处在于,它们对目标细胞类型表现出显著的特异性。”特威希博士是杰克森实验室的副教授,并且是这项工作的共同通讯作者。
这为我们提供了在仅一个组织中上调或下调基因表达的机会,而不影响身体的其他部分。
近年来,基因编辑技术和其他基因疗法使科学家能够改变活细胞内的基因。然而,仅在选定的细胞类型或组织中影响基因,而不是在整个生物体中进行,一直很困难。这在一定程度上是因为持续面临着理解控制基因表达和抑制作用的DNA开关(称为顺式调控元件(CREs))的挑战。
发表在10月23日线上的论文中自然泰维和他的合作者不仅设计了新的、前所未见的合成CREs,而且还利用这些CREs成功地在脑细胞、肝细胞或血细胞中激活基因,而不开启其他类型细胞中的那些基因。
尽管生物体中的每个细胞都含有相同的基因,但并不是所有基因在每个细胞或任何时刻都是必需的。CRE(调控元件)有助于确保大脑中所需的基因不会被皮肤细胞使用,或者在发育早期需要的基因不会在成人体内被激活。CRE本身不是基因的一部分,而是独立的、具有调节功能的DNA序列——通常位于它们所控制的基因附近。
科学家们知道人类基因组中有数千种不同的CRE,每一种都有略微不同的作用。但CRE的语法难以理解,“没有直接控制每个CRE功能的简单规则,”Tewhey实验室的计算科学家、新论文的共同第一作者Rodrigo Castro博士解释道。
这限制了我们设计仅影响人体某些细胞类型的基因疗法的能力。
“这个项目本质上提出了一个问题:‘我们能否学会阅读和编写这些调控元件的代码?’”耶鲁大学遗传学助理教授Steven Reilly博士,也是该研究的主要作者之一说道。
如果我们从语言的角度考虑,这些元素的语法和句法知之甚少。因此,我们尝试构建机器学习方法,以便能够学习比我们自己能做的更为复杂的代码。
使用一种形式的人工智能(AI)被叫到深度学习该团队使用实验室测量的来自人类基因组的数十万个DNA序列训练了一个模型,这些序列在三种类型的细胞(血液、肝脏和大脑)中具有CRE活性。AI模型使研究人员能够预测任何可能组合中的序列的活性。
通过分析这些预测,研究人员发现了DNA中的新模式,了解了DNA中CRE序列的语法如何影响RNA的生成量——这是基因被激活程度的一个代理指标。
该团队包括Pardis Sabeti博士,DPhil,本研究的共同通讯作者以及Broad研究所的核心成员和哈佛大学教授,随后开发了一个名为CODA(DNA活性计算优化)的平台,利用他们的AI模型高效地设计了数千种全新且具有特定特性的CREs,例如在人类肝细胞中激活某个特定基因,但在人类血液或脑细胞中不激活同一基因。
通过反复结合“湿”实验和“干”分析的方法,使用实验数据为了首先构建然后验证计算模型,研究人员精炼并改进了程序预测每个CRE的生物学影响的能力,并使设计从未在自然界中出现过的特定CRE成为可能。
"天然CREs虽然数量众多,但它们仅代表可能的遗传元素中微不足道的一部分,并且其功能受到限制。"自然选择,“该研究的共同第一作者Sager Gosai博士说,他是萨贝蒂实验室的一名博士后研究员。
这些人工智能工具在设计基因开关方面具有巨大的潜力,可以精确调节基因表达,用于生物制造和治疗等新型应用,而这些应用超出了自然选择的压力范围。
泰韦和同事们通过将这些新的人工设计的合成CRE插入细胞中,并测量它们在目标细胞类型中激活基因的效果,以及它们避免在其他细胞中表达基因的能力,来测试了这些新的CRE。他们发现,这些新的CRE比已知与特定细胞类型相关联的天然存在的CRE更具细胞类型特异性。
“这些合成的CREs与天然元件在语义上相差甚远,以至于它们的有效性预测似乎不太可能实现,”戈沙伊说。“我们最初预计许多序列在活细胞内会表现异常。”
卡斯楚说:“令我们惊喜的是,CODA在设计这些元素方面表现得非常好。”
特韦和其合作者研究了为什么合成的CRE能够优于天然存在的CRE,并发现细胞特异性的合成CRE包含了负责表达的序列组合。基因在目标细胞类型中,以及在其他细胞类型中抑制或关闭该基因的序列。
最后,该团队在斑马鱼和小鼠中测试了几种合成的CRE序列,并取得了良好的结果。其中一个CRE能够在发育中的斑马鱼肝脏中激活荧光蛋白,但在鱼体的其他任何区域都没有激活。
这项技术为编写具有预定义功能的新调控元件铺平了道路,”Tewhey说。“此类工具对于基础研究很有价值,但同时也可能在生物医学方面产生重大影响,在这种情况下,你可以使用这些元件来非常精确地控制基因表达。细胞类型“用于治疗目的。”
更多信息:Ryan Tewhey等,机器指导的设计细胞类型靶向顺式调控元件自然 (2024). DOI: 10.1038/s41586-024-08070-z. www.nature.com/articles/s41586-024-08070-z
期刊信息: 自然
引用AI设计的DNA开关可以开启和关闭基因,实现精确激活或抑制(2024年10月23日) 检索于2024年10月24日 从https://phys.org/news/2024-10-ai-dna-flip-genes-precise.html
本文件受版权保护。除个人研究或学习目的的合理使用外,未经书面许可,不得以任何形式复制。所提供的内容仅用于信息目的。