来源:Briefings in Bioinformatics
作者:Wei Xu、Gang Luo、Weiyu Meng、Xiaobing Zhai等
单位:澳门理工大学、中国科学院软件研究所计算机科学国家重点实验室等
发表时间: 2025年02月
一、论文介绍
背景:医学研究中因果推断至关重要,但传统方法依赖临床经验和文献回顾,过程繁琐且易遗漏信息。
核心: 基于这一背景,论文提出了MRAgent框架,利用LLM自动从科学文献中提取潜在的暴露-结果对,并利用全基因组关联研究(GWAS)数据进行MR因果推断。MRAgent能够自动化地完成从文献检索到因果分析的全过程,显著提高了因果知识发现的效率和准确性,为医学研究提供了一个强大的自动化工具。
二、展示 LLM 驱动的因果分析系统架构
- MRAgent的三层结构:Brain(智能决策)、Memory(数据表记忆)、Toolkit(执行工具)
- LLM负责控制整个流程,类似研究者思考—行动的循环
- 这是系统的核心逻辑图,体现从输入疾病到输出因果推断的全流程

这是整篇论文的技术核心,展示了作者提出的 MRAgent 系统的结构。它基于LLM,实现从海量文献中自动提取、比对、验证“暴露–结果”因果对。模块包括文本预处理、因果对识别、证据验证和输出可信度评估。
对比传统MR分析流程与MRAgent自动化流程

左图展示了传统MR分析的人工流程,包括手动文献检索、因果对识别、GWAS数据选择和MR分析。右图展示了MRAgent的自动化流程,从文献检索到MR分析的全过程由LLM驱动。
引入一个“失败重试机制”(例如某个反事实验证未通过,重新调整融合权重再验证)。让 LLM 根据收敛度或共识比动态调整Prompt或权重参数。
展示标注策略与数据决策逻辑

人工标注决策树通过两层判断(是否与文章一致、是否与关键词相关),将文献中的证据分为三类:Label A(核心证据)、Label B(补充证据)和Label C(排除)。

标签决策树的具体应用案例,以“Lung Cancer (LC)”为关键词,展示了一篇PubMed文献中暴露-结果对的标签结果:
Label A:如“CXCL5(暴露)→NSCLC(结果)”,既符合文章主题(肺癌进展),又与关键词强相关;
Label B:如“CXCL5代谢物(暴露)→治疗结局(结果)”,虽与文章相关但与“Lung Cancer”关键词关联较弱;
Label C:如“NETosis(暴露)→CD8 T细胞功能障碍(结果)”?(注:图中示例中“NETosis in neutrophils”作为暴露、“CD8 T cell dysfunction”作为结果,实际应属于Label A,需结合上下文确认,此处按图示逻辑说明)
三、实际应用案例(低背痛研究)展示完整流程与最终因果结论

通过一个低背痛研究案例,展示了MRAgent如何从文献中提取因果对并进行MR分析。在这个案例中,研究人员输入“Outcome: back pain”(结果:背痛),MRAgent自动检索相关文献,提取与背痛相关的暴露因素(如“spondylolysis”即脊椎滑脱),并识别出潜在的因果对。随后,MRAgent利用GWAS数据对这些因果对进行MR分析,最终得出结论:脊椎滑脱与慢性低背痛之间存在因果关系。这个案例证明了MRAgent在自动化因果知识发现中的有效性和实用性,能够快速从海量文献中挖掘出有价值的因果关系,为医学研究和临床实践提供支持。
四、实验
在不同模型的识别结果与相似度;

识别是否已有MR分析的准确率;

STROBE-MR质量评估准确率;

GWAS选择性能(Precision/Recall/F1)

展示MRAgent与人工在各步骤耗时对比LLM平均提速上百倍;人工30分钟的任务,MRAgent仅需几秒;突出了系统自动化的效率优势

五、论文总结
论文提出了基于LLM的自动化因果知识发现框架MRAgent,用于疾病因果关系的发现。
(1)因果对抽取: MRAgent通过PubMed检索文献,利用LLM提取“暴露–结果”对,并记录是否进行过因果分析。
(2)文献评估: 自动检查文献中是否已有MR分析,并评估分析质量,避免重复分析或遗漏重要因果对。
(3)GWAS数据分析: 自动选择OpenGWAS数据,进行MR分析,生成详细报告。
六、对齐思考
(1) 架构升级:受 MRAgent 智能体三层结构(Brain–Memory–Toolkit)启发,将经络–免疫因果系统从线性流程升级为具备自我规划与反馈的闭环架构。
(2) 动态评估: 借鉴 MRAgent 的人工决策树评估方法,引入动态评估机制,使 Evidence Triangulation 从静态加权转为自适应判断。
(3) 流程标准化:参考 MRAgent 的端到端疾病案例展示,以标准化“高血压–眩晕”流程复刻验证链,提升了系统的完整性与可对比性。