本报讯 深度学习模型AlphaGenome于1月29日在《自然》发布。该模型能预测100万碱基对的DNA序列的功能,以及DNA序列变异如何影响不同的生物过程。此外,AlphaGenome还能用于理解遗传疾病、改进基因检测,并为开发新疗法提供信息。
基因变异会影响生物学过程并可能引发疾病,但理解DNA序列变化如何影响其功能一直是个难题。约98%的变化发生于非编码区域,即不编码蛋白质但影响基因表达的DNA区域,使得预测其影响变得非常困难。要解决这一问题需要计算模型,现有方法在序列长度和预测强度上必须做出取舍,但AlphaGenome却能在长DNA序列中做出高分辨率预测。
谷歌深度思维(DeepMind)的Ziga Avsec、Natasha Latysheva、Pushmeet Kohli和同事展示了AlphaGenome的能力。这一模型通过人类和小鼠基因组的训练来学习DNA序列如何影响不同的生物过程。AlphaGenome可以即时预测5930种人类或1128种小鼠遗传信号,这些信号与特定功能有关,如基因表达、剪接(基因组的切割与重组)和蛋白质修饰。在26项变异效果预测评估中,有25项的结果与现有顶尖模型表现相当或更优。作者指出,该模型优势在于能同时对多种遗传信号和生物学结果进行多重预测。
作者写到,进一步改进这一工具或能拓展其应用,例如增加涵盖的物种或拓展模型识别非编码序列的范围。他们总结说,AlphaGenome有望深化对DNA序列变异引发的复杂生物学结果的理解。(赵熙熙)
相关论文信息:
https://doi.org/10.1038/s41586-025-10014-0
<!-- 非定向300*250按钮 17/09 wenjing begin -->
<!-- 非定向300*250按钮 end -->
</div>
未经允许不得转载:紫竹林-程序员中文网 » 深度思维新模型可预测DNA变异影响