本发明涉及计算机,尤其涉及一种问答结果确定方法及装置。
背景技术:
1、大语言模型是指基于深度学习技术训练的大规模自然语言处理模型。这些模型通常使用神经网络结构,特别是变换器(transformer)架构,通过海量的文本数据进行预训练,能够学习到丰富的语言知识和语言规律。大语言模型的核心功能是能够理解和生成人类语言,具有强大的文本生成能力,并且能够处理各种自然语言处理任务,如对话系统等。
2、现有的基于大语言模型的问答系统所采用的外部数据库是提前预置的,导致其突出的不足点是其内容的滞后性,使得问答结果的准确性不高。
技术实现思路
1、本发明提供一种问答结果确定方法及装置,用以提升问答结果的准确性。
2、本发明提供一种问答结果确定方法,包括:
3、获取第一待检索请求,并基于大语言模型,对所述第一待检索请求进行改写,生成第二待检索请求;
4、基于所述第一待检索请求以及所述第二待检索请求,进行网络搜索,得到多个响应网页链接,并从所述多个响应网页链接中确定本地知识库中包含的第一链接以及所述本地知识库中不包含的第二链接,所述本地知识库用于提供问答信息的多个网页链接及其对应的网页信息;
5、从所述本地知识库中,提取所述第一链接对应的第一网页信息,并从网络中确定所述第二链接对应的第二网页信息,并基于所述第一网页信息以及所述第二网页信息,构建网页数据库;
6、基于所述第一待检索请求以及所述第二待检索请求,以及所述网页数据库,确定所述第一待检索请求的初始问答结果。
7、根据本发明提供的一种问答结果确定方法,基于所述第一待检索请求以及所述第二待检索请求,以及所述网页数据库,确定所述第一待检索请求的初始问答结果,包括:
8、基于所述第一待检索请求与所述网页数据库中各网页的语义相似度,以及所述第二待检索请求与所述网页数据库中各网页的语义相似度,从所述各网页中确定与所述第一待检索请求以及所述第二待检索请求的关联网页;
9、将所述第一待检索请求、所述第二待检索请求以及所述关联网页输入大语言模型进行问答结果提取,得到所述大语言模型输出的问答结果;
10、将所述大语言模型输出的问答结果作为所述第一待检索请求的初始问答结果。
11、根据本发明提供的一种问答结果确定方法,基于所述第一待检索请求与所述网页数据库中各网页的语义相似度,以及所述第二待检索请求与所述网页数据库中各网页的语义相似度,从所述各网页中确定与所述第一待检索请求以及所述第二待检索请求的关联网页,包括:
12、基于文本嵌入模型,将所述第一网页信息转换为第一文本向量,并将所述第二网页信息转换为第二文本向量;
13、基于所述第一文本向量与所述网页数据库中各网页对应的索引向量的相似度,以及所述第二文本向量与所述网页数据库中各网页对应的索引向量的相似度,从所述各网页中确定与所述第一待检索请求以及所述第二待检索请求的关联网页。
14、根据本发明提供的一种问答结果确定方法,确定所述第一待检索请求的初始问答结果之后,还包括:
15、将所述初始问答结果与所述关联网页中的网页内容进行匹配,确定匹配结果;
16、基于所述匹配结果,对所述初始问答结果进行校正,得到所述第一待检索请求的校正问答结果。
17、根据本发明提供的一种问答结果确定方法,将所述初始问答结果与所述关联网页中的网页内容进行匹配,确定匹配结果,包括:
18、基于匹配校正公式,确定所述初始问答结果与所述关联网页中网页内容的匹配分数;
19、将所述匹配分数大于预设分数阈值的内容作为所述匹配结果;
20、所述匹配校正公式为:
21、
22、其中,表示匹配分数,gram1表示所述关联网页中的1个词语,ai表示初始问答结果中第i个句子,是统计ai的语义单元数目,是统计ai与第k个关联网页共有的语义单元数目。
23、根据本发明提供的一种问答结果确定方法,从网络中确定所述第二链接对应的第二网页信息之后,还包括:
24、将所述第二网页信息输入时效分类模型,对所述第二网页信息进行时效判断,确定所述第二网页信息中各信息的时效等级;
25、基于所述第二网页信息中各信息的时效等级,确定所述第二网页信息中的非时效信息,并将所述非时效信息添加至所述本地知识库,所述时效分类模型是基于网页信息及其对应的时效等级标签训练得到的。
26、根据本发明提供的一种问答结果确定方法,还包括:
27、确定所述本地知识库中各网页链接的调用次数,并基于所述调用次数,对所述本地知识库中的网页链接进行更新。
28、本发明还提供一种问答结果确定装置,包括:
29、检索请求生成模块,用于获取第一待检索请求,并基于大语言模型,对所述第一待检索请求进行改写,生成第二待检索请求;
30、链接筛选模块,用于基于所述第一待检索请求以及所述第二待检索请求,进行网络搜索,得到多个响应网页链接,并从所述多个响应网页链接中确定本地知识库中包含的第一链接以及所述本地知识库中不包含的第二链接,所述本地知识库用于提供问答信息的多个网页链接及其对应的网页信息;
31、网页数据库构建模块,用于从所述本地知识库中,提取所述第一链接对应的第一网页信息,并从网络中确定所述第二链接对应的第二网页信息,并基于所述第一网页信息以及所述第二网页信息,构建网页数据库;
32、问答结果确定模块,用于基于所述第一待检索请求以及所述第二待检索请求,以及所述网页数据库,确定所述第一待检索请求的初始问答结果。
33、本发明还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种问答结果确定方法。
34、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种问答结果确定方法。
35、本发明提供的问答结果确定方法及装置,通过大语言模型,对第一待检索请求进行改写,生成第二待检索请求,并对第一待检索请求以及第二待检索请求进行网络搜索,确定本地知识库中包含的第一链接以及不包含的第二链接。从本地知识库中,提取第一链接对应的第一网页信息,并从网络中确定第二链接对应的第二网页信息,实现了对请求对应的本地以及网络信息的获取。基于第一网页信息以及第二网页信息,构建用于确定问答结果的网页数据库,使得在基于大语言模型生成问答结果的过程中,能实时获取本地数据以及网络数据,提升了问答结果的准确性。
1.一种问答结果确定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的问答结果确定方法,其特征在于,所述基于所述第一待检索请求以及所述第二待检索请求,以及所述网页数据库,确定所述第一待检索请求的初始问答结果,包括:
3.根据权利要求2所述的问答结果确定方法,其特征在于,所述基于所述第一待检索请求与所述网页数据库中各网页的语义相似度,以及所述第二待检索请求与所述网页数据库中各网页的语义相似度,从所述各网页中确定与所述第一待检索请求以及所述第二待检索请求的关联网页,包括:
4.根据权利要求2所述的问答结果确定方法,其特征在于,所述确定所述第一待检索请求的初始问答结果之后,还包括:
5.根据权利要求4所述的问答结果确定方法,其特征在于,所述将所述初始问答结果与所述关联网页中的网页内容进行匹配,确定匹配结果,包括:
6.根据权利要求1所述的问答结果确定方法,其特征在于,所述从网络中确定所述第二链接对应的第二网页信息之后,还包括:
7.根据权利要求1所述的问答结果确定方法,其特征在于,还包括:
8.一种基于问答结果确定装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述问答结果确定方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述问答结果确定方法。
