司法领域大模型调研三 方向参考 大模型生成数据,提升数据质量。大模型生成数据作为训练数据,即便存在问题也可以说明,存在幻觉问题。 司法数据集已经有很多公开的数据集了,并不存在数据稀疏。 大模型对知识图谱数据的获取方面有哪些研究。 司法数据隐私安全方面,联邦学习是否可以解决。 数据时效性,数据动态更新问题,如何更新,更新效率,高低频案件变化问题。 时序知识图谱看能否运用。 调研任务 研究现状: 1. 数据集构建 2023-11-01 科研学习 #NLP,KG
司法领域大模型调研二 调研任务司法领域大模型应用研究:对应修改申报书国内外研究现状部分(面向司法知识图谱的基础数据构建)根据上述目标可以细分以下调研思路: 继续调研司法大模型国内外研究与应用现状。 阅读申报书国内外研究现状部分,补充完善已有的并加入代表性的。 研究现状强调研究领域的重要性:法律知识体系是多种逻辑和知识的结合,知识图谱能够表达这种逻辑关联,并显示被关联的体系内的知识。 123url: https:// 2023-10-24 科研学习 #NLP,KG
Dateframe—Algorithm some key points with respect to dataframe-algorithm 2023-03-17 算法学习 #Dataframe-Algorithm
BERT Pre-training of Deep Bidirectional Transformers for Language Understanding BERT(Bidirectional Encoder Representations from Transformers)是一种创新的语言表示模型,它通过从无标签文本中预训练深度双向表示,利用Transformers架构在每一层都同时考虑了词汇的左右上下文。这种方法使得BERT模型在经过简单的微调后,就能在多种NLP任务上达到最先进的水平,包括但不限于问答和语言推断任务。BERT的设计理念简单而有 2024-02-28 科研学习 #NLP #DL #科研 #Transformer