清华团队提出药物相互作用预测方法,预测准确率提升近三成


来源:DeepTech深科技

近日,清华大学姚权铭副教授团队提出了一套全新的 药物相互作用预测方法 —— CBR-DDI  框架。 这项研究首次把临床医生常用的 参考过往病例 CBR Case-Based Reasoning )方法引入到大语言模型( LLM Large Language Model )中,显著提升了药物相互作用预测的准确性和可解释性。实验表明, CBR-DDI  框架能够让模型在两个主流数据集上的准确率 平均提升  28.7% 超过了大语言模型和  CBR  基线。

图丨姚权铭(来源:资料图)

日前,相关论文以《案例推理可提升大语言模型在药物相互作用预测中的能力》 (Case-Based Resoning Enhances the Predictive Power of LLMs in Drug-Drug Interaction)  为题发表在预印本网站 arXiv [1]

图|相关论文(来源:

arXiv )

药物相互作用( DDI Drug Drug Interaction )是指两种或多种药物共同使用时,可能产生的疗效增强、副作用增加甚至危险反应。准确预测  DDI  对医疗安全至关重要:它能帮助医生避免处方冲突,也能在新药研发时提前识别潜在风险,从而节省巨额的临床试验成本。

但  DDI  的预测极具挑战性。药物之间可能通过代谢酶竞争等复杂机制产生相互作用,尤其 对于新药物而言,由于缺乏历史数据,预测更为困难。 虽然近年来大语言模型在生物医药领域展现了潜力,但直接用于  DDI  预测时仍面临难题:首先是 缺乏可解释性, 模型可以给出预测,却无法给出潜在药理机制,使得其可靠性大打折扣;其次是 泛化能力不足, 对新药物缺乏先验知识,难以迁移到未知场景。

图|

Naive-CBR  和  CBR-DDI  方法对比(来源: arXiv )

该研究的灵感来自临床实践。在现实中,医生在面对复杂病情时,通常会 查阅相似的历史病例, 并结合其中的治疗经验来推断新的决策。 CBR-DDI  正是把这种人类经验迁移的思路引入大语言模型当中。

其核心设计是建立一个 案例知识库 将历史药物对的交互机制系统化存储,然后在预测新药物时,通过检索和比对,让 模型能够参考过去的案例。 病例库中的每个药物对都包含药物描述、药物关联、相互作用机制以及相互作用类型。其中,药物描述以及其潜在可能的相互作用机制由  LLM  生成,药物关联信息由图神经网络由图神经网络( GNN Graph Neural Network )模块从知识图谱中( KGs biomedical knowledge graph )提取的结构化知识。

CBR-DDI  的框架也运用了相同的方法,首先通过大语言模型生成药物功能描述,并同时用  GNN  捕捉药物在知识图谱中的结构关系。混合检索策略 将语义相似度与结构相似度相结合,从病例库中找到最接近的历史案例。这些病例与药物的结构关系共同构造成 双层知识提示 ,引导大模型输出预测结果。 为避免病例库无限扩大,团队还引入了 代表性抽样策略, 去除冗余样本,仅保留最具代表性的机制案例,从而兼顾效率与覆盖度。

团队在两个主流数据集 —— DrugBank  和  TWOSIDES 上对  CBR-DDI  进行了系统验证。结果显示在涉及新药物预测的任务中, CBR-DDI  的表现全面领先,与现有的  Naive-CBR  方法相比,准确率提升了  28.7% 值得注意的是,即便配合较小模型(如  Llama-3.1-8B ),也能超越许多先进神经网络方法。而在大型模型(如  Llama-3.1-70B DeepSeek-V3 )的加持下, CBR-DDI  达到了目前该领域的最佳成绩。

图|不同模型在 

DrugBank  数据集上实验准确度(来源: arXiv )

研究团队在消融实验中分析了  CBR-DDI  框架中各个模块的作用。在 双层知识增强提示 中去掉病例机制信息和药物关联信息两者其之一会导致性能下降,缺少病例机制的影响更为明显,说明病例推理起了重要作用。团队还通过调整语义相似度与结构相似度的权重评估混合检索策略,发现当两者保持平衡时,检索到的病例最为相关,模型预测也最准确。而对代表性抽样策略的实验表明,该方法可将病例库规模压缩超过  90% ,但同时保持预测性能。

在研究团队提供的一个示例中,模型可以检索到与  Rifabutin  与  Zopiclone  相似的药物交互机制,并由此推断出  Rifabutin  可能通过诱导 CYP2C9  和  CYP3A4  酶,加速  Zopiclone  的代谢。这说明  CBR-DDI  可以通过整合历史医药案例,给出以 药物作用机制为基础的逻辑推理, 并得到了准确可靠的结果。

目前,该预测模型还有一定局限性,即病例库以及预测只依靠文字信息,而没有分子结构等数据。未来,团队计划进一步扩展病例库的信息, 引入分子结构数据, 帮助提供更准确的预测,同时为案例库中  LLM  生成的内容设计自动化的校验方法,为每个案例提供更加准确、深入的药理学解释。

参考资料:

1.https://arxiv.org/pdf/2505.23034

2.Y. Wang, Z. Yang, Q. Yao. Accurate and Interpretable Drug-drug Interaction Prediction Enabled by Knowledge Subgraph Learning.  Communications Medicine.  2024

3.H. Du, Q. Yao, J. Zhang, Y. Liu, Z. Wang. Customized Subgraph Selection and Encoding for Drug-drug Interaction Prediction. Annual Conference on Neural Information Processing Systems (NeurIPS). 2024

4.Z Shen, M Zhou, Y Zhang, Q Yao. Benchmarking graph learning for drug-drug interaction prediction.  Arxiv . 2024.

5.Y. Zhang, Q. Yao, L. Yue, X. Wu, Z. Zhang, Z. Lin, Y. Zheng. Emerging Drug Interaction Prediction Enabled by Flow-based Graph Neural Network with Biomedical Network.  Nature Computational Science . 2023.

01/  黄仁勋随特朗普访英:26亿美元下注英国AI,智驾公司Wayve或获5亿美元加码

02/  AI遥操人工受精,美国初创已促成首例AI试管婴儿诞生

03/  DeepSeek梁文锋论文登上Nature封面,AI大模型首次通过同行评审

04/  告别单一物体生成!李飞飞团队突破AI限制,创建大规模持久3D几何体

05/  中科院软件所成果获英伟达重点引用,用大模型重构求解器研发范式,打造EDA领域更强核心引擎

]article_adlist–>

            <!-- 非定向300*250按钮    17/09  wenjing  begin -->
            <!-- 非定向300*250按钮  end -->
        </div>



Source link

未经允许不得转载:紫竹林-程序员中文网 » 清华团队提出药物相互作用预测方法,预测准确率提升近三成

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的