本发明涉及一种增强大模型私人助理记忆能力的方法、装置和介质,属于大模型。
背景技术:
1、随着人工智能技术的快速发展,大型语言模型可以作为个人助理应用于日常生活,提供从回答问题到管理日程的各种服务,甚至能够进行日常对话。该实现主要包含几个过程:切分知识文件和向量化、问题文本向量化与相似度计算、根据问题与相关文本生成回答。然而,为了真正提升用户体验并使这些助理更接近人类,为其配备有效维护和利用长期记忆的能力至关重要。
2、目前,依赖模型的的交互依赖于短期记忆来处理用户请求,这限制了它们在处理长期对话时的性能。一些尝试通过存储对话摘要或人格化信息来构建长期记忆的方法,面临着信息过时或矛盾的问题。此外,现有技术在处理长期记忆中的冗余信息时,往往采用简单的删除或忽略策略,这可能会导致重要信息的丢失,影响对话的质量和用户体验。
技术实现思路
1、本发明目的是提供了一种增强大模型私人助理记忆能力的方法、装置和介质,增强记忆连贯性,改善用户体验。
2、本发明为实现上述目的,通过以下技术方案实现:
3、将知识文件进行文本切分生成文本片段,对文本片段向量化后进行存储;
4、将问题文本向量化为问题向量,检索存储的向量化后的文本片段,进行相似度计算;
5、根据相似度计算结果确定知识文件中与问题对应的文本片段;
6、将问题文本输入私人助理,更新私人助理记忆生成一个反映用户的最新偏好和历史信息的响应;
7、将问题文本和对应的文本片段输入大模型中,结合私人助理生成的响应输出问题答案。
8、优选的,所述私人助理生成响应具体方式如下:
9、上下文感知查询生成,学习当前对话上下文;
10、私人助理使用生成的查询在长期记忆库中检索与当前对话相关的信息,找到最相关的历史记忆片段;
11、记忆融合与精炼,更新记忆库;
12、基于更新后的记忆库和当前的对话上下文,私人助理生成一个反映用户的最新偏好和历史信息的响应。
13、优选的,私人助理学习当前对话上下文方法如下:使用预训练的大型语言模型生成一个与当前对话内容相关的查询,将其作为检索过去记忆中相关信息的基础。
14、优选的,记忆融合与精炼具体方式如下:将检索到的记忆与当前对话中的新信息进行融合,生成新的记忆片段,私人助理评估新旧记忆之间的关系,确定全新记忆、冗余记忆和过时记忆的。
15、优选的,记忆精炼完成后,私人助理更新其记忆库,移除冗余和过时记忆,将全新记忆添加到记忆库中;
16、优选的,所述大型语言模型为chatglm_3_turbo。
17、本发明的优点在于:本发明增强记忆连贯性,通过上下文感知查询生成和记忆融合与精炼,私人助理能够生成与当前对话紧密相关的查询,从而检索和整合与用户历史对话相关的信息,确保了对话的连贯性。同时,改善用户体验,用户感觉到与私人助理的交流更加自然和个性化,因为私人助理能够记住用户的历史信息并据此做出响应,这提升了用户的整体体验。
1.一种增强大模型私人助理记忆能力的方法,其特征在于,包括:
2.根据权利要求1所述的增强大模型私人助理记忆能力的方法,其特征在于,所述私人助理生成响应具体方式如下:
3.根据权利要求1所述的增强大模型私人助理记忆能力的方法,其特征在于,私人助理学习当前对话上下文方法如下:使用预训练的大型语言模型生成一个与当前对话内容相关的查询,将其作为检索过去记忆中相关信息的基础。
4.根据权利要求3所述的增强大模型私人助理记忆能力的方法,其特征在于,记忆融合与精炼具体方式如下:将检索到的记忆与当前对话中的新信息进行融合,生成新的记忆片段,私人助理评估新旧记忆之间的关系,确定全新记忆、冗余记忆和过时记忆的。
5.根据权利要求4所述的增强大模型私人助理记忆能力的方法,其特征在于,记忆精炼完成后,私人助理更新其记忆库,移除冗余和过时记忆,将全新记忆添加到记忆库中。
6.根据权利要求2所述的增强大模型私人助理记忆能力的方法,其特征在于,所述大型语言模型为chatglm_3_turbo。
7.一种增强大模型私人助理记忆能力的装置,包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在运行所述程序指令时,执行如权利要求1-6任一所述的增强大模型私人助理记忆能力的方法。
8.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,该程序被处理器执行时实现如上述权利要求1-6任一所述的方法。