大语言模型融合知识图谱的问答系统研究
本研究着眼于大语言模型(Large Language Model,LLM)和知识图谱的融合应用,旨在解决当前LLM在垂直领域的表现不理想和对硬件的高要求等挑战。为此,我们设计了一套垂直领域的问答系统,具备信息过滤、专业问答和抽取转化三个能力。
我们收集了中医药方剂领域的相关数据,并对数据进行预处理,以提供高质量的输入数据。然后,我们基于LLM和知识图谱设计了问答系统,该系统可以过滤出垂直领域相关的问题,并输入LLM进行回答。同时,我们还基于LLM和自建知识库来生成更具备专业知识的回答,相比于专业数据的微调方法,该技术无需重新训练即可部署垂直领域大模型。
此外,我们还强化了LLM的信息抽取能力,利用其生成的自然语言回答,从中抽取出结构化知识,并和专业知识图谱匹配以进行专业验证,同时可以将结构化知识转化成易读的自然语言,实现了大模型与知识图谱的深度结合。
我们通过专家主观评估与选择题客观评估两个实验从主客观两种角度验证了系统的性能。实验结果表明,该系统可以有效地回答垂直领域相关的问题,且具有良好的可扩展性和灵活性。
知识点:
1. 大语言模型(Large Language Model,LLM):是一种基于深度学习的语言模型,可以生成自然语言文本,具有理解和响应人类指令的能力。
2. 知识图谱:是一种基于图结构的知识表示方法,可以描述实体、关系和属性之间的关系。
3. 垂直领域:是指特定的领域或行业,例如中医药方剂领域。
4. 问答系统:是一种基于自然语言处理的系统,可以回答用户提出的问题。
5. 信息过滤:是指从大量数据中提取出相关信息的过程。
6. 专业问答:是指基于专业知识和领域特定的问答系统,可以生成更具备专业知识的回答。
7. 抽取转化:是指从自然语言文本中抽取结构化知识,并将其转化成易读的自然语言的过程。
本研究的贡献在于,设计了一套垂直领域的问答系统,解决了当前LLM在垂直领域的表现不理想和对硬件的高要求等挑战。该系统可以应用于各种垂直领域,例如中医药方剂领域,提高了问答系统的智能化和自动化水平。