202501论文研读-Optimizing Query Generation for Enhanced Document Retrieval in RAG

作者:Hamin Koo, Minseon Kim, Sung Ju Hwang

来源:arXiv

发表时间:202407

背景

•RAG通过检索文档来提供基于检索到文档中的事实信息的更准确的用户查询答复。

•然而,RAG并未完全根除幻觉,因此出现大量研究用来提高RAG的准确性。

•一个不完善的RAG系统,常常因为模糊不清的查询而引发误导,导致没能准确捕捉到用户的真实意图。

QOQA

•一种精确查询优化方法(Query Optimization using Query expAnsion,QOQA)

•利用前k个平均查询-文档对齐得分,借助LLMs来精炼查询。这种方法既计算效率高,又能提升文档检索的精确性,减少误导。

•在实验中,这种方法能够以平均1.6%的提升率,准确提取所需文档。

•输入原始查询,并通过检索器获取相关文档。

•将原始查询与检索到的顶级文档合并,形成扩展查询,并提交给LLM以产生一系列重新表述的查询。

•经过改写的查询将根据其与检索文档的契合度进行评估,相应的查询-文档对齐得分及其查询文本将被存入查询池。

提示词模板

•将提示模板更新为包含原始查询、检索文档以及排名靠前的查询改写。

•为确保性能超越原始查询,始终在模板中融入原始查询信息。

•在后续的优化环节,会根据得分生成一个经过优化的查询,并将其加入到查询池中。

查询-文档对齐得分计算

•基于稀疏检索的BM25分数

•基于密集检索的密集分数

•融合了稀疏与密集检索的混合分数

结论

•由QOQA生成的改写查询相较于原始查询,在精确度和具体性上更胜一筹。

•QOQA方法产生的查询能够精准地包含“纳米”或“分子证据”等关键词汇,从而有效抓取最为贴切的文档。这种对关键词的精准把控确保了改写查询与答案文档在词汇上的更高重合度。

核心内容与综合思考

核心内容

•提出了一种精确查询优化方法(QOQA),利用前k个平均查询-文档对齐得分,借助LLMs来精炼查询。

•这种方法既计算效率高,又能提升文档检索的精确性,减少误导。

•在实验中,这种方法能够以平均1.6%的提升率,准确提取所需文档。

综合思考

•查询中的关键词的精确性对于查询到到的文档的精确性有着至高重要的作用。

•融合稀疏检索与密集检索的混合分数计算方式将查询用在稀疏或密集检索中的评分结合起来,更能检验查询的有效性。