信息处理方法、装置、系统及电子设备与流程

专利2025-11-11  10


本申请的实施例涉及人工智能,特别涉及一种信息处理方法、装置、系统及电子设备。


背景技术:

1、传统的对话生成模型由于在大量的社交媒体的数据上预训练,尽管进行规则式且模型打分筛选,依然存在严重的人设不稳定、回复风格混乱、回复价值不高且多轮连贯性较差的缺点,即使在少量的角色化风格数据上微调,也会在风格化数据上过拟合而损失通用的应答能力。并且目前的对话生成模型过度依赖大语言模型,导致回复时间过长。


技术实现思路

1、本申请的实施例提供一种信息处理方法、装置、系统及电子设备,以解决现有技术中对话处理模型的回复时间过长的技术问题。

2、为了解决上述技术问题,本申请的实施例公开了如下技术方案:

3、第一方面,提供了一种信息处理方法,应用于对话系统,包括:

4、确定当前对话信息;

5、基于参照信息改写所述当前对话信息,得到目标对话信息;所述参照信息包括所述当前对话信息的关联信息;

6、基于所述目标对话信息进行信息交互,响应于所述目标对话信息满足第一约束,基于信息源执行检索步骤,以确定第一交互结果;

7、将所述目标对话信息和所述第一交互结果输入预置的大语言模型,得到回复信息;

8、其中,所述第一约束被配置为表征人设陈述类信息和/或知识类问题,所述信息源被配置为表征内部信息或外部信息。

9、结合第一方面,基于所述目标对话信息进行信息交互,还包括:

10、响应于所述目标对话信息满足第二约束,执行匹配步骤;

11、所述匹配步骤被配置为将所述目标对话信息输入预置的大语言模型,以获得第二交互结果;

12、其中,所述第二约束被配置为表征请求类信息。

13、结合第一方面,所述参照信息包括时间信息、地点信息、人物信息、物品信息中至少一者;所述时间信息包括年份、月份、日期、小时、分钟、早上、上午、中午、下午、晚上、半夜以及凌晨中的一种或多种。

14、结合第一方面,确定所述目标对话信息,将所述目标对话信息转换为文本短句,并将所述文本短句存储于所述信息源的内部信息中;

15、响应于所述检索步骤,提取相应的所述文本短句;

16、其中,所述文本短句包括提示信息、机器事件、对话内容、用户信息、用户事件、用户相关人的信息和用户相关人的事件中的一种或多种;

17、所述提示信息包括所述回复信息的属性和风格。

18、结合第一方面,响应于所述文本短句被提取的次数少于预设提取阈值,将所述文本短句从所述信息源的内部信息中删除。

19、结合第一方面,所述大语言模型基于缓存库生成回复信息;所述缓存库被配置为暂存所述提示信息和所述参照信息。

20、结合第一方面,基于simcse和faiss构建的检索模型进行所述检索步骤,并通过正负样本对所述检索模型进行训练,训练的损失函数公式包括:

21、

22、其中,τ为可调节的温度,hi为原样本,和均为hi的正例样本,和均为hi的负例样本,sim此处取为余弦相似度,n为样本数量,j为序数,取自1至n的正整数,e为自然对数底数。

23、第二方面,提供了一种信息处理装置,配置于对话系统,包括:

24、当前对话数据确定模块,用于确定当前对话数据;

25、目标对话信息确定模块,用于参照信息改写所述当前对话信息,得到目标对话信息;所述参照信息被配置为表征所述当前对话信息的关联信息;

26、信息交互模块,用于基于所述目标对话信息进行信息交互,响应于所述目标对话信息满足第一约束,基于信息源执行检索步骤,以确定第一交互结果;

27、其中,所述第一约束被配置为表征人设陈述类信息和/或知识类问题,所述信息源被配置为表征内部信息或外部信息。

28、结合第二方面,所述信息处理装置还包括:

29、生成式模块,用于基于所述第一交互结果和目标对话信息,调用预置的大语言模型,以输出所述对话系统的回复信息。

30、第三方面,提供了一种信息处理系统,所述系统包括:信息处理模块和大语言模型模块;

31、所述信息处理模块被配置为基于参照信息改写目标用户的当前对话信息,以获得目标对话信息,并调用所述大语言模型模块;

32、所述大语言模型模块基于所述目标对话信息和提示信息生成回复信息;

33、其中,所述参照信息被配置为表征所述当前对话信息的关联信息,所述提示信息被配置为表征所述大语言模型模块的回复信息的属性和风格。

34、第四方面,提供了一种电子设备,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如第一方面中任一项所述的信息处理方法。

35、上述技术方案中的一个技术方案具有如下优点或有益效果:

36、与现有技术相比,本申请的一种信息处理方法,应用于对话系统,包括:定当前对话信息;基于参照信息改写当前对话信息,得到目标对话信息;参照信息包括当前对话信息的关联信息;基于目标对话信息进行信息交互,响应于目标对话信息满足第一约束,基于信息源执行检索步骤,以确定第一交互结果;将目标对话信息和第一交互结果输入预置的大语言模型,得到回复信息;其中,第一约束被配置为表征人设陈述类信息和/或知识类问题,信息源被配置为表征内部信息或外部信息。本申请提供的信息处理方法在回复之前通过参照信息对目标对话信息进行改写获得目标对话信息,对目标对话信息基于信息源进行检索,确定第一交互结果,通过预置的大语言模型基于目标对话信息和第一交互结果输出回复信息,提高了对话系统对信息的处理能力,加快了对话系统的反应速度,对系统的算力要求小。



技术特征:

1.一种信息处理方法,其特征在于,包括:

2.如权利要求1所述的一种信息处理方法,其特征在于,基于所述目标对话信息进行信息交互,还包括:

3.如权利要求1所述的一种信息处理方法,其特征在于,所述参照信息包括时间信息、地点信息、人物信息、物品信息中至少一者;所述时间信息包括年份、月份、日期、小时、分钟、早上、上午、中午、下午、晚上、半夜以及凌晨中的一种或多种。

4.如权利要求3所述的一种信息处理方法,其特征在于,确定所述目标对话信息,将所述目标对话信息转换为文本短句,并将所述文本短句存储于所述信息源的内部信息中;

5.如权利要求4所述的一种信息处理方法,其特征在于,响应于所述文本短句被提取的次数少于预设提取阈值,将所述文本短句从所述信息源的内部信息中删除。

6.如权利要求5所述的一种信息处理方法,其特征在于,所述大语言模型基于缓存库生成回复信息;所述缓存库被配置为暂存所述提示信息和所述参照信息。

7.如权利要求2所述的一种信息处理方法,其特征在于,基于simcse和faiss构建的检索模型进行所述检索步骤,并通过正负样本对所述检索模型进行训练,训练的损失函数公式包括:

8.一种信息处理装置,配置于对话系统,其特征在于,包括:

9.如权利要求8所述的信息处理装置,其特征在于,所述信息处理装置还包括:

10.一种信息处理系统,其特征在于,所述系统包括:信息处理模块和大语言模型模块;

11.一种电子设备,其特征在于:包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如权利要求1-7中任一项所述的信息处理方法。


技术总结
本申请公开了一种信息处理方法、装置、系统及电子设备,应用于对话系统,包括:确定当前对话信息;基于参照信息改写当前对话信息,得到目标对话信息;参照信息包括当前对话信息的关联信息;基于目标对话信息进行信息交互,响应于目标对话信息满足第一约束,基于信息源执行检索步骤,以确定第一交互结果;将目标对话信息和第一交互结果输入预置的大语言模型,得到回复信息。本申请提供的方法在通过改写获得目标对话信息,对目标对话信息基于信息源进行检索,确定第一交互结果,通过预置的大语言模型基于目标对话信息和第一交互结果输出回复信息,提高了对话系统对信息的处理能力,加快了对话系统的反应速度,对系统的算力要求小。

技术研发人员:李亚,俞沛,王栋,刘权,王士进,刘聪,胡国平
受保护的技术使用者:科大讯飞股份有限公司
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1824749.html

最新回复(0)