作者:Neuroscience News
摘要:研究人员开发了一种人工智能算法ARC-SV,用于检测人类基因组中先前方法遗漏的复杂结构变异。通过对超过4,000个基因组进行分析,研究人员发现了数千个复杂的变异,其中许多影响与大脑相关的基因,并且这些变异与精神分裂症和双相情感障碍有关联。
这些变异通常位于大脑功能的关键区域,影响基因的表达方式,提供了关于精神疾病风险的新见解。这一突破为更深入地理解精神障碍以及开发新的治疗方法铺平了道路。
关键事实:
来源:斯坦福大学
构成人类基因组的30亿个碱基对——腺嘌呤与胸腺嘧啶配对、胞嘧啶与鸟嘌呤配对的拼图碎片——不仅仅是身体的操作手册。
碱基对顺序的重新排列是疾病起源和我们进化历史的标志。这些变化可能是简单的,比如几个碱基对交换位置;也可能是复杂的,例如一段包含数万碱基对的序列发生反转,并且缺失了多个部分。
目前最先进的读取基因组的技术,称为全基因组测序,在寻找简单变异方面是合适的,但在寻找复杂的结构变异时却力有不逮。
现在一项由斯坦福医学院领导的新研究开发了一种基于人工智能的方法,能够从全基因组测序数据中识别复杂的结构变异。
该研究于9月30日发表在细胞创建了一个复杂结构变异目录,使用了来自世界各地的超过4,000个人类基因组。这些变异通常发生在控制大脑功能的基因中,并且出现在与人类进化相关的基因组区域。
研究人员还展示了某些复杂的结构变异影响了在被诊断为精神分裂症或双相情感障碍的人的大脑中,与大脑相关基因所含指令的读取方式。
“这项工作在揭示精神障碍的遗传和分子基础方面取得了重大进展,并表明与大脑相关的疾病以及总体上具有强烈遗传成分的疾病应进行复杂的结构变异分析。”该研究的主要作者、精神病学和行为科学副教授兼遗传学助理教授亚历山大·乌尔班博士说。
“任何全基因组序列都应该通过这个新算法进行处理;这将使我们能够发掘出当前被忽略的数据中的重要答案。”
城市和王咏(Wing Wong),博士,斯蒂芬·R·皮尔斯家族高盛科学与人类健康教授及统计学与生物医学数据科学教授,是共同通讯作者。 注意:这里“Urban”可能是一个人名,并非常见的地名“城市”,如果需要准确翻译此人名,请告知具体音译或意译需求。
到目前为止,在人类基因组中发现的几乎所有变异都比较简单。但新算法的输出显示,每个基因组还包含大约80至100种复杂的结构变异。
“只寻找简单的变体就像校对一本书的手稿时,仅仅搜索那些改变单个字母的错别字。”Urban说。
“你可能忽略了拼写错误、重复的词语或词序颠倒的问题——甚至可能会漏掉整整半章不见了的情况。在稿件送交印刷厂之前,这些问题都应该被发现。”
自动重构复杂结构变异算法,简称ARC-SV,能够捕捉各种DNA重排,并在寻找复杂结构变异时具有95%的准确率。
该算法使用了一个AI模型,并且是在来自具有多样祖先背景的人类的数十个完整基因组(称为泛基因组)上进行训练的。
算法发现了超过8000种不同的复杂结构变异,这些变异的长度在200到100,000个碱基对之间。许多变异位于调控大脑发育和功能的基因组区域。
研究人员更仔细地检查了这些变异是否与精神病疾病相关。
轻松地找到并研究复杂的结构变异有助于解释哪些基因组变化会导致可遗传的精神疾病。该研究考察了两种这样的疾病,即精神分裂症和双相障碍。
全基因组关联研究(称为GWAS)已经识别出许多携带精神疾病诊断风险的基因组位置。但GWAS的结果未能提供足够的细节来解释遗传风险,以便采取行动。
“我们在识别精神疾病遗传成分方面取得了惊人的进展,但仍然有一些重要的东西缺失,”Urban说。
“全基因组关联研究的结果告诉我们与某种疾病相关的某些DNA变化在基因组中的位置。但来自全基因组关联研究的信息有些模糊。这就像知道一本书的第118页、237页和304页上有一些错误,但我们不知道这些错误的具体类型或涉及哪些词语。”
Urban解释说,虽然GWAS结果可能会引导研究人员查看第118页上有什么问题,但知道复杂的结构变异序列就像是在那一页实际的10个单词的句子中用高亮笔标记了一个拼错的单词和一个重复的单词。
“就是那个意思,”他说。
研究人员对ARC-SV算法的输出进行了测试。他们使用了来自超过100个健康个体以及被诊断为精神分裂症或双相情感障碍者的死后脑组织样本的全基因组序列和基因表达测量,来探究复杂的结构变异可能产生的影响。
这些变异倾向于位于或重叠于已知与患精神分裂症或双相障碍风险相关的GWAS位置附近。
复杂的结构变异也影响了附近基因的表达——改变了包含在DNA中的指令读取结果——这表明这些变异可能有助于疾病的产生。
“识别和研究复杂的结构变异将使我们更深入地了解DNA的变异方式,并提供分子线索,这些线索将有助于绘制从健康到疾病发生的生物功能轨迹以及疾病的治疗路径,”精神病学与行为科学讲师周博博士(该研究的第一作者)说。
作者:金伯莉·达伦neas
来源:斯坦福大学
联系人:金伯利·达丹恩 – 斯坦福大学
图片:图片来自Neuroscience News
原创研究:开放访问。
“跨人群和患有精神障碍的捐赠者大脑中复杂结构变异的检测与分析周博等人的论文标题为」细胞
摘要
跨人群和患有精神障碍的捐赠者大脑中复杂结构变异的检测与分析
复杂的结构变异(cxSVs)在基因组分析中常常因检测难度而被忽略。我们开发了ARC-SV,这是一种基于概率和机器学习的方法,能够从标准数据集中准确地检测和重建cxSVs。
通过在代表所有大陆人口的4,262个基因组中应用ARC-SV,我们确定了cxSV是自然人类遗传变异的一个重要来源。罕见的cxSV倾向于发生在神经基因和经历了快速的人类特有进化的位点上,包括那些调节皮层生成的位点。
通过在尸检大脑中进行单核多组学分析,我们发现与不同脑区和细胞类型中的基因表达和染色质可及性差异相关的cxSVs。
此外,在精神病病例大脑中检测到的cxSVs与在同一大脑中检测到的精神病GWAS风险等位基因连锁富集。
此外,我们的分析揭示了精神疾病病例中cxSV基因在特定脑区和细胞类型中的表达显著降低,这表明cxSV参与了主要神经精神病障碍的分子病因。