2503论文研读-JingFang: A Traditional Chinese Medicine Large Language Model of Expert-Level Medical Diagnosis and Syndrome Differentiation-Based Treatment

作者:Yehan Yang,Tianhao Ma,Ruotai Li,Xinhan Zheng,Guodong Shan,Chisheng Li.
单位:Beijing University of Posts and Telecom-munications,Southeast University.
来源:arXiv
时间:2025.2

一、论文概述

研究背景:
中医诊断和治疗需要依赖大量的专业知识和经验:传统中医在诊断和治疗过程中强调辨证论治,需要医生反复询问患者症状、病史,并结合舌脉、体质、环境等因素分析。但在实践中,一方面缺乏结构化、系统化的多轮问诊数据,另一方面中医知识也难以在通用大模型中得到充分呈现。
现有大模型在中医场景的应用面临挑战:通用LLMs可能无法精准获取中医特征信息,也无法对复杂的中医症候进行有效推理,导致诊断不全面、辨证不准确、治疗建议缺乏个性化与权威性。
研究目的:
开发多智能体动态协同推理机制:该机制通过模拟真实中医咨询过程,结合不同中医专科领域的智能体(Agent),动态协作完成全面的患者信息收集和精准的辨证论治。这一机制旨在提高模型在多轮咨询中的交互能力和信息处理能力,为准确诊断奠定基础。
提升中医辨证论治能力:研究中开发了“中医辨证智能体”,并结合双阶段检索方案,显著增强模型在中医辨证论治方面的表现。

二、主要内容

JF框架包含三个核心模块:
中医咨询模块:通过“多代理动态协作思维链(MD-CCTM)”模拟专家会诊,动态整合专科代理(如内科、妇科)与通用代理的咨询建议,优化多轮提问逻辑。
中医辨证模块:基于TCM证候代理,结合“十问歌”框架清洗数据(去除无关仪器检查等噪声),提升证型分类精度。
中医治疗模块:采用双阶段检索方案(DSRS),先按证型筛选候选处方,再通过向量相似度匹配个性化治疗方案。
关键技术
MD-CCTM:通过多代理协作迭代优化咨询思维链,确保问题全面性与针对性。
DSRS:融合密集向量(语义匹配)与稀疏向量(关键词匹配)检索,结合RRF算法混合排序,提升治疗推荐的精准性。
数据清洗方法:基于“十问歌”结构化提取症状信息,构建高质量中医辨证数据集。

三、实验评估

四、论文总结

多智能体动态协同推理机制(MDCCTM)
模拟真实中医咨询过程,结合不同中医专科领域的智能体(Agent),动态协作完成全面的患者信息收集。
通过多轮咨询,逐步深入收集患者信息,避免关键信息遗漏,为准确诊断提供基础。
中医辨证智能体(Syndrome Agent)
结合高质量的中医数据集和双阶段检索方案(DSRS),提升模型在中医辨证论治方面的能力。
通过数据预处理和结构化,确保模型能够精准识别患者的证型。
双阶段检索方案(DSRS)
在治疗建议阶段,通过双阶段检索从中医处方数据库中筛选最适合患者的治疗方案。
结合患者的具体情况,提供个性化的治疗建议。