202510论文研读-RELRaE: LLM-Based Relationship Extraction, Labelling, Refinement, and Evaluation

作者：George Hannah, Jacopo de Berardinis, Terry R. Payne等
来源：arXiv:2507.03829v1
单位：University of Liverpool、Unilever Plc
发表日期：2025.7

一、论文介绍

实验室自动化加速了科学实验的数据生成，但大量实验数据以 XML 形式存储，仅具结构化语法，缺乏可供推理的语义信息。

不同实验室和系统间的数据语义不一致，使得实验结果难以共享、整合或构建统一的知识图谱

传统由领域专家手工完成的本体构建过程耗时、昂贵且易受主观影响，限制了科学数据的语义化与自动化发展。

旨在提出一种融合规则与大语言模型（LLM）的混合框架 RELRaE，通过四阶段流程实现从 XML 模式到本体结构的自动化转换。该框架依次完成关系抽取、标签生成、标签精修与自动评估，既利用规则保持结构一致性，又借助 LLM 提升语义准确性，并引入“LLM-as-a-Judge”机制减少人工验证负担，从而实现高质量、低成本的半自动本体生成过程。

二、核心内容

关系抽取

目标：从 XML Schema 中识别候选概念对及其层级关系，为后续关系标注奠定结构基础。

主要方法：
输入：XML Schema 文件（包含元素、属性、类型定义等）。
解析层级结构，抽取候选概念对（如父子节点、属性隶属关系）。
捕捉直接关系（Parent–Child）与间接关系（祖孙、属性链）。
提取关联的文本注释（Annotation），为后续 LLM 精修提供语义上下文。

规则标注

目标：利用结构模式规则为每个关系对生成初步的语义标签，构建原始的知识三元组。
主要方法：
基于 Bohring & Auer (2005) 的 XML→OWL 映射思想，定义结构-关系模板。
不同类型的节点组合对应不同标签形式：
ComplexType → SimpleType → has<Property> ComplexType → Attribute(boolean) → is<Property> 同类型结构继承 → subClassOf
若无匹配规则，采用默认命名规则：前缀“has + Range 名称”。
模块称为 RuBREx（Rules-Based Relationship Extraction）。

标签精修

目标：利用大语言模型优化初步标签的语义准确性，使关系名称更符合领域知识与上下文。
主要方法：
使用 LLM（如 GPT-4）对规则生成的标签进行语义判断与修正。
构造“角色 + 领域 + 任务”式提示语：
示例：“你是一位分析化学专家，请判断标签‘hasComponent’是否准确描述给定关系，如不合适请改进。”
融入 few-shot 提示策略，提供领域示例提升一致性。
在部分实验中添加文档注释（documentation）增强语义上下文。

自动评估

目标：通过第二个 LLM 自动评估生成标签的合理性，减少人工验证成本。
主要方法：
采用另一模型（如 Gemini）执行 “LLM-as-a-Judge” 任务。
对每个关系标签打分（Likert 五级尺度：No→Yes）。
设置接受标准：
“Likely (4)” 或 “Yes (5)” → 标签通过；
低于标准 → 回退至规则标签。
少量真实标签用于训练验证器，平衡人工成本与效果。

三、实验评估

四、总结思考

论文总结

核心方法：提出混合式的 RELRaE 框架，将规则系统与 LLM 语义理解结合，用于从 XML Schema 自动生成关系标签与基础本体。
实验结果：RELRaE 在标签准确性上显著优于纯规则或纯LLM方案；LLM评审机制可替代部分专家审核工作。
优势总结：
显著降低人工参与成本
保留专家方法的结构化可控性
提高标签的语义一致性与质量
LLM-as-a-Judge 提供高效质量控制手段

启发思考

1.“LLM抽取 + LLM 精修 + LLM 评审” 的三阶段流程，可推广到知识抽取、自动标注、RAG数据构建等场景；

2.可借鉴其 LLM 解释性评估机制，在我方知识库建设中引入“自动预标注 + 轻量验证器 + 人工复审”的高质量管控模式；

3.后续研究可尝试让 LLM 直接参与语义关系发现与本体扩展，实现更智能的知识结构生成。