司法领域KG-LLM调研四
本文最后更新于:1 年前
调研任务
- 将各个关键点搜索相关文献进行总结。
- 调研关于司法领域的KG与LLM相互作用的文献,有则加之,无责阐述与司法相关的关系作为创新点。
知识图谱与事理图谱
知识图谱增强大模型
1.KG强化LLM预训练
知识图谱通常包含从高度可信的来源进行提取、处理并经过人工评估审查的信息。LLM仅使用单独的自然语言文本可能导致信息覆盖范围有限,因此,来自知识图谱的结构化显式信息可以被融入到LLM预训练语料库中,从而提高LLM的可靠性与泛化性能,有助于解决大模型的幻觉问题。为此国内外学者对此方向进行多种研究。
- Fedor Moiseev提出了一种通过直接在知识图谱(KG)的事实三元组上训练 T5 模型来将KG结构化知识注入LLM的方法。此方法在 Wikidata KG 上预训练的模型优于 FreebaseQA 和 WikiHop 上的 T5 基线,在管理训练数据时不需要知识图谱和文本语料库之间的对齐,有助于处理行业规模的知识图。
- Cicero Nogueira dos Santos我们提出了一种训练软提示的新方法,通过使用同一组 KP 来提高 LM 在三个不同任务中的性能:问答、事实检查和关系分类,从而证明了以实体为中心的 KP 可以被视为一种通用的知识库嵌入方法,可用于扩展 LM 的世界知识。
- 将外部特定领域知识(例如 UMLS)注入预训练语言模型 (LM) 可以提高其处理专业领域内任务的能力,刘方宇提出了一种有效的迁移学习方案,利用通用领域翻译来提高领域专业表示模型的跨语言能力解决了将特定领域知识从资源丰富的语言转移到资源贫乏的语言的挑战。
- Barlas Oguz提出 UniK-QA统一结构化和非结构化信息源的预训练LLM在生成和QA任务上性能有所提高。
- Pat Verga通过将向量表示的可解释性神经符号知识库在预训练和微调期间增强到LLM,显著强化了模型在知识密集型QA任务中的性能。
2.KG微调更新LLM
有许多研究运用知识图谱来拓展和优化提示生成,相较于传统的手工方法,这种方式在提示数量、质量和多样性方面都有显著的增加。
2. 侯越先整合KG等外部显示知识帮助提示工程,尤其是通过提供实体的附加上下文(例如属性、Khop 邻居),以帮助 LLM 生成更好的预测。
3. 张宁豫使用 KnowPrompt 这样的方法将KG中关系标签之间的语义和先验知识合并到关系提取的提示调整中,增强提示构建过程并通过结构化约束优化其表示。
4. 可以通过 KG 2 Instruction技术将知识图谱的转化成指令用于微调,叶宏彬通过OntoPrompt将本体用于提示微调。
5. Yoonjoo Lee凭借有意义的学习模式和KG的大量遍历路径的支持,实现低成本KG单轮和多轮脚手架提示。
6. Siyuan Cheng提出编辑 KGE 模型允许直接修改LLM的知识以适应特定任务,从而提高编辑过程的效率和准确性,并且 KGE 能在不影响整体性能的情况下更新特定事实进而更新LLM。
7. Nicola De Cao提出通过知识图谱的三元组对大语言模型进行编辑从而实现知识更新,Mojtaba Nayyeri将大语言模型跟知识图谱通过表示学习进行融合。
3.KG增强LLM推理和可解释性
事实上,研究表明,从通用数据集训练中获得的知识主要是关于流行实体的。然而,对于特定领域的知识,可能有一些LLM尚未可知的潜在的重要知识,包括无法纳入LLM的私人和业务关键知识。LLM可以通过检索增强方法来获取外部知识,从而解决知识中断的问题。知识图谱可以表示和生成思维链,将知识从大模型中解耦出来,通过结构化更好的思维链提升大模型的推理和可解释能力,可以对医疗、法律等专精垂域知识库上的可解释推理问答提供新思路。
- 崔家喜使用外挂知识库的方式增强大模型输出的效果,将用户输入的问题放入知识库中进行检索,并将相关的文档片段取出后与原始输入问题进行合并等操作后,将其作为新的输入送入大模型中,这样能够减轻 LLM 输出的“幻觉”问题。
- 鄂海红在利用大模型强大的学习能力以及自然语言理解能力的同时,利用知识图谱的准确性和可解释性来弥补了大模型可能的幻觉现象以及本身的黑盒短板,将知识从大模型中解耦出来,实现可解释推理问答的LLM+KG新范式。
- Wang-Chiew Tan整合不同的显性知识,包括非结构化知识(例如段落)和结构化知识(例如知识图谱和数据库),以增强LLM,实现半参数LLM。
- Xingxuan Li提出了知识链(CoK-Li),它通过查询生成器从知识库获取结构化知识来执行知识引导推理。
- Jianing Wang 还从知识库中检索结构化知识。它从事实性和忠实性方面估计推理链,并提示模型重新思考不可靠的推理,从而减轻 CoK-Li 中的知识检索错误。
- Keheng Wang提出KD-CoT通过多轮 QA 方法解决事实推理问题。他们设计了一个反馈增强检索器,用于检索每轮 QA 中的相关外部知识,以校准推理过程。
大模型增强知识图谱
1.LLM辅助KG自动建模
- Wenxuan Zhou提出了一个统一的预训练多语言表示模型 Prix-LM ,用于多语言知识库的构建和完成,通过随意的LM 目标进行训练,利用单语言知识三元组和跨语言链接,它将不同语言的知识库中的知识嵌入到共享的表示空间中,这有利于在语言之间转移互补知识,可以捕获、传播和丰富多语言知识库中的知识。
2.LLM促进KG融合更新
- Shibo Hao提出了一种应用GPT-3的方法,以输入实体对和手动种子提示自动生成一个加权的提示 en- semble。然后,再次使用PLM进行搜索,并将排名靠前的实体对与集合体进行配对,以使KG完成补全。
- Pengcheng Jiang提出 TAGREAL,它自动生成高质量的查询提示并从大型文本语料库中检索支持信息,以探测 PLM 中的知识以完成知识图谱补全。
3.LLM增强KG知识表示
- Jiho Kim提出了 KG-GPT,这是一个利用 LLM 来完成使用 KG 的任务的多功能框架。 KG-GPT 通过句子分割、图检索和推理三个步骤分别用于分割句子、检索相关图组件和得出逻辑结论,该模型表现出较强竞争力和稳健的性能,甚至优于几个完全监督的模型。
高价值参考文献
1 |
|
评测基准
司法大模型综合评价方法:
1 |
|
1 |
|
个人总结
以上均为KG与LLM相互增强的部分国内外研究现状,目前尚未调研到有关司法领域的KG与LLM相互增强协同运用的研究,只是提到可以将两者结合运用到司法领域,但是已有部分企业做了相关产品,如LLMs+知识图谱!Spotlight领域大模型产品发布加速公安智能化
1 |
|
1 |
|