作者:William A. Haseltine
遗传学研究的最新突破可能发现了常见精神疾病背后的新基因。精神分裂症和双相情感障碍影响着全世界超过 6400 万人。这些疾病受遗传的影响很大。然而,没有任何一种基因可以决定一个人患精神分裂症或双相情感障碍的风险。相反,许多基因很可能会导致风险。斯坦福大学的研究人员现在利用人工智能发现了整个人类基因组中可能导致这些精神疾病的复杂变异。这新研究表明受精后发生的突变,例如基因嵌合,可能是导致许多精神疾病的原因,包括双相情感障碍和精神分裂症。
将基因组视为一本活生生的书,其中包含体内每个细胞的说明。我们的基因就是章节。我们大约有 20,0000 个基因,它们为制造蛋白质(生命的组成部分)提供指令。然而,我们的绝大多数基因都是非编码的,这意味着它们不提供蛋白质的指令。尽管如此,这些基因在遗传学和调节细胞功能中发挥着重要作用。
编码区或非编码区的遗传变异或拼写变化可能会干扰细胞翻译特定指令的方式。一个小错别字可能对本书的阅读方式几乎没有影响。然而,较大的拼写变化可能会导致删除句子甚至整个章节。如果没有正确的指令来产生特定的蛋白质,这些拼写变化可能会导致影响我们身体不同方面的疾病。
我们的基因是我们从父母那里继承的 DNA 的组合。我们每个基因都有两个拷贝,一个来自妈妈,另一个来自爸爸。这些随机分类的基因对决定了头发质地、眼睛颜色甚至一些健康风险等特征。有些性状是显性的,这意味着仅需要变体的一个副本来表达。其他的是隐性的,只有当两个副本相同时才会出现。这被称为孟德尔遗传,以格雷戈尔·门德博士对基因如何在豌豆中传递的最初观察结果命名。
在生命的最初阶段,DNA 经历多轮复制。发生数万亿次细胞分裂,在此期间一个细胞分裂成两个相同的子细胞。然而,DNA 复制很容易出错。每次细胞分裂时,基因组中都会产生微小的拼写错误。因此,怀孕前三个月的快速复制可能会带来一系列在妈妈或爸爸身上看不到的基因变化。这被称为遗传嵌合体,其中两个或多个遗传上不同的细胞群在体内表达。马赛克可以表现为两只不同颜色的眼睛,或交替的皮肤图案,如下所示。许多疾病也与嵌合体有关,例如发育迟缓、自闭症、癫痫和一些癌症。我们的身体里都有一定程度的基因嵌合。这就是为什么同卵双胞胎可能有不同的指纹。
遗传变异也可以在个体的一生中获得,从而进一步改变我们的基因组镶嵌。DNA 的变化可能是由于接触化学物质或辐射而引起的,也可能是由于乙型肝炎和丙型肝炎等感染破坏了宿主细胞中的遗传物质而引起的。其他变体是随机获得的。DNA 在复制和其他正常细胞功能过程中可能会出现错误。炎症、衰老以及吸烟和不良饮食等生活方式的选择会加剧这种损害。因此,查明哪些变异导致某些疾病有时可能是一个非常复杂的过程。
全基因组测序 (WGS) 可以帮助识别 DNA 的微小变化。这种基因测试使用从血液或检查拭子中收集的样本绘制个体的整个基因组图谱。全基因组测序提取构成我们 DNA 每一章的精确序列。然后将提取的序列与典型人类基因组的参考基因进行比较。个体基因组与参考基因组之间的任何差异都揭示了可能与疾病相关的潜在变异。
这项研究的资深作者、斯坦福大学副教授亚历山大·厄本 (Alexander Urban) 描述道:“仅寻找简单的变化就像校对书稿并专门搜索改变单个字母的拼写错误一样。你忽略了那些打乱、重复或顺序错误的单词——你甚至可能会错过半章已经消失的情况。——事实上,某些疾病可能与个人长期、复杂的拼写变化有关——的基因。由于多个基因的变异可能与不止一种疾病重叠,这一事实使情况变得更加复杂。
许多精神疾病都受到相似基因的多重变化的影响。双相情感障碍和精神分裂症是人类基因组复杂性的典型例子。已发现数百种导致风险的基因变异。其中许多基因与大脑发育、免疫系统调节和神经元信号通路有关。特别是 AKAP11 基因已被发现是双相情感障碍的一个强烈危险因素,尽管最近对小鼠的研究表明该基因也可能与精神分裂症有关。了解该基因的拼写变化如何与其他高风险变体相互作用可能有助于破译导致精神症状发作的原因。
在他们的研究中,Zhou 等人。al 比较了世界各地 4,000 多人的基因组。他们的整个 DNA 序列是通过全基因组测序提取的。然后,这些数据被上传到人工智能算法中,该算法经过训练可以识别不同血统的数十个基因组。这种方法使研究人员能够将大型、复杂的基因变异与特定的健康状况相匹配。
该研究专门招募了已知患有双相情感障碍或精神分裂症的个体,并将他们与健康对照进行比较。这种方法被称为全基因组关联研究(GWAS)。全基因组关联研究将患有特定疾病的个体的基因与一大群对照者进行比较。虽然这种方法可以告诉我们变体所在的位置,但该信息通常并不准确。例如,它可能告诉我们该书在第 122、296 和 731 页上包含拼写更改,但没有告诉我们涉及什么类型的错误。Zhou等人开发的AI算法。al 增加了更多的特异性。它会突出显示更改的单词或句子,并报告其是否已被打乱、重复或删除。
该人工智能工具识别出 8,000 多个复杂变体,准确率超过 85%。许多拼写变化是在为大脑功能提供指令的基因组区域中发现的。为了确定这些变异是否与精神疾病有关,他们从精神分裂症或双相情感障碍患者的脑组织样本中提取了 DNA。他们发现的复杂变异似乎与这些疾病的其他全基因组关联研究中发现的单一变异重叠。例如,他们发现与精神分裂症和双相情感障碍相关的一种复杂变异是 4,700 个碱基对的长度,这是 DNA 的基本单位。在书本类比中,碱基对就像书中的单词。
基因研究的新创新正在加深我们对人类基因组的理解。通过分析大量的遗传数据,人工智能技术正在揭示大变异与某些精神疾病之间的复杂关系。这不仅增强了我们对这些疾病遗传基础的理解,而且为个性化医疗铺平了道路。随着我们不断发现更多的人类基因组,未来的研究可能会揭示对一系列疾病的遗传基础的更深入的了解。