一种信息识别方法及装置与流程

专利2022-05-09  126


本申请涉及人工智能技术领域,尤其涉及一种信息识别方法及装置。



背景技术:

随着ai技术的发展,chatbot(对话系统)应用已经非常广泛,并且对chatbot的系统性能提出来了更高的要求。chatbot的槽位的识别率、交流轮次是评价chatbot的重要性能指标,能够在更少的交流轮次中获取更多的信息才能够有效提高用户体验。对话系统完整的nlu(naturelanguageunderstanding,自然语言理解)包括领域意图识别和槽位提取。领域意图识别用于告诉机器用户查询的内容,例如:查询天气,槽位提取用于告诉机器对于所识别到的意图需要填充的槽位的详细的信息,例如:查询天气的时间、查询天气的地点、音视频播放的内容进度和播放音视频的日期等。在槽位提取过程中,由于数据、模型等因素的限制,易导致槽位的遗漏,从而导致需要填充的槽位信息的缺失。

目前主要采用启动下二轮对话的方式来解决这一问题,机器主动询问用户未识别到的槽位信息。例如,用户提出“我可能过两天要去别的地方出差,嗯然后估计要在硅谷待几天,穿什么有推荐吗”。chatbot只识别出领域意图是查询天气,查询天气需要填充的槽位包括时间和地点,地点是北京,但遗漏了时间,此时系统将发起第二轮对话,询问用户需要查询哪一天的时间。该方案中交流轮次的增加,对于用户问题的处理时间有一定延迟,影响chatbot性能,并严重降低用户的体验感。

申请内容

本申请提供一种信息处意图识别模块理方法及装置。

根据本申请第一方面,提供了一种信息处理方法,所述方法包括:接收待处理信息;对所述待处理信息进行意图识别,得到所述待处理信息的目标意图;根据所述目标意图,对所述待处理信息进行第一次槽位信息提取,得到所述待处理信息包括的第一槽位集;基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集;根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果。

根据本申请的另一实施例,基于所述目标意图信息和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集,包括:根据所述第一槽位集,对所述待处理信息进行特征提取,得到第二次槽位特征提取的输入特征向量;对所述输入特征向量进行槽位信息提取,得到所述第二槽位集。

根据本申请的另一实施例,所述输入特征向量包括所述待处理信息包括的字的字向量、位置向量和槽位标签向量;相应的,所述根据所述第一槽位集,对所述待处理信息进行特征提取,得到第二次槽位特征提取的输入特征向量,包括:根据所述第一槽位集包括的第一槽位标签信息,确定所述待处理信息包括的字的槽位标签向量;确定所述待处理信息的字的字向量和位置向量;其中,所述位置向量用于示出所述待处理信息中的每一个字在所述待处理信息中的位置。

根据本申请的另一实施例,对所述输入特征向量进行槽位信息提取,得到所述待处理信息包括的第二槽位集,包括:对所述输入特征向量进行拼接,得到拼接向量;对所述拼接向量进行降维处理,得到编码向量;对所述待处理信息进行语义分析,得到语义分析结果;根据所述语义分析结果,确定所述待处理信息的字的语义向量;根据所述目标意图,确定所述待处理信息的字的意图向量;对所述编码向量、所述语义向量和所述意图向量进行归一化处理,得到所述待处理信息包括的第二槽位集。

根据本申请的另一实施例,所述对所述待处理信息进行语义分析,得到语义分析结果,包括:对所述待处理信息进行句法构造和依存关系分析中的至少之一,得到所述语义分析结果。

根据本申请的另一实施例,在基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取之前,所述方法还包括:获取若干个训练语料,所述训练语料包括语句内容、所述语句内容的意图信息和槽位标签信息;根据所述语句内容、所述意图信息和所述槽位标签信息,训练第一槽位信息提取模型,以对所述待处理信息进行第一次槽位信息提取。

根据本申请的另一实施例,所述方法还包括:对所述槽位标签信息的至少部分槽位标签进行模糊化处理,得到槽位标注结果;根据所述语句内容、所述意图标注结果和所述槽位标注结果,训练第二槽位信息提取模型,以对所述待处理信息进行第二次槽位信息提取。

根据本申请的另一实施例,对所述槽位标签信息的至少部分槽位标签进行模糊化处理,得到槽位标注结果,包括:采用随机抽取的方式,对所述槽位标签信息中的至少部分标签进行掩蔽处理,得到所述槽位标注结果。

根据本申请的另一实施例,所述根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果,包括:对所述第一槽位集和所述槽位集进行合并,得到槽位标签集合和槽位词汇集合;对所述槽位标签集合和所述槽位词汇集合进行去重处理,得到所述信息识别结果。

根据本申请第二方面,还公开了一种信息识别装置,所述装置包括:接收模块,用于接收待处理信息;意图识别模块,用于对所述待处理信息进行意图识别,得到所述待处理信息的目标意图;第一提取模块,用于根据所述目标意图,对所述待处理信息进行第一次槽位信息提取,得到所述待处理信息包括的第一槽位集;第二提取模块,用于基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集;信息处理模块,用于根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果。

本申请实施例信息处理方法及装置,在接收到待处理信息后,首先,对所述待处理信息进行意图识别,得到所述待处理信息的目标意图;其次,根据所述目标意图,对所述待处理信息进行第一次槽位信息提取,得到所述待处理信息包括的第一槽位集;并且,基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集;最后,根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果。如此,增加第二次槽位信息提取过程,充分的利用各个槽位之间的关系、主题信息以及结构信息等,有效召回第一次槽位信息提取过程中所遗漏的槽位,有效增加槽位信息提取的准确率和效率。从而,有效减少信息交互过程中的交流轮次,显著提升用户体验。

需要理解的是,本申请的教导并不需要实现上面所述的全部有益效果,而是特定的技术方案可以实现特定的技术效果,并且本申请的其他实施方式还能够实现上面未提到的有益效果。

附图说明

通过参考附图阅读下文的详细描述,本申请示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本申请的若干实施方式,其中:

在附图中,相同或对应的标号表示相同或对应的部分。

图1示出了本申请一实施例信息识别方法的实现流程示意图;

图2示出了本申请另一实施例信息识别方法的实现流程示意图;

图3示出了本申请一实施例信息识别方法的第二槽位信息提取模型的模型结构示意图;

图4示出了本申请实施例信息识别装置的组成结构示意图。

具体实施方式

下面将参考若干示例性实施方式来描述本申请的原理和精神。应当理解,给出这些实施方式仅仅是为使本领域技术人员能够更好地理解进而实现本申请,而并非以任何方式限制本申请的范围。相反,提供这些实施方式是为使本申请更加透彻和完整,并能够将本申请的范围完整地传达给本领域的技术人员。

首先,对本申请的应用场景进行简单说明,本申请实施例中信息识别方法主要应用于信息交互过程中,例如:智能音箱、智能客服与用户交互过程中,接收到用户发送的信息,并对所接收的信息进行响应。接收的用户发送的信息可以是文本信息也可以是音频信息,对该信息进行识别,得到识别结果,以针对识别结果,对用户做出响应。当然,以上仅仅是对本申请技术方案应用场景的简单示例,本申请技术方案同样可以应用于其他适用的场景。

下面结合附图和具体实施例对本申请的技术方案进一步详细阐述。

图1示出了本申请一实施例信息识别方法的实现流程示意图。

参考图1,本申请实施例信息处理方法,至少包括如下操作流程:操作101,接收待处理信息;操作102,对待处理信息进行意图识别,得到待处理信息的目标意图;操作103,根据目标意图,对待处理信息进行第一次槽位信息提取,得到待处理信息包括的第一槽位集;操作104,基于目标意图和第一槽位集,对待处理信息进行第二次槽位信息提取,得到待处理信息包括的第二槽位集;操作105,根据第一槽位集和第二槽位集,确定待处理信息的信息识别结果。

在操作101,接收待处理信息。

在本申请这一实施例中,待处理信息可以是音频信号,也可以是文本内容。如果待处理信息是音频信号,这里需要首先将音频信号转换为文本内容。

在操作102,对待处理信息进行意图识别,得到待处理信息的目标意图。

在本申请这一实施例中,采用nlp(naturelanguageprocess,自然语言处理)过程中通用的意图识别方法即可实现对待处理信息的意图识别。例如:待处理信息的文本内容为“我可能过两天要去别的地方出差,嗯……然后,估计要在深圳待几天,穿什么有推荐吗?”,对该待处理信息进行意图识别,得到待处理信息的目标意图为“查询天气”。

在操作103,根据目标意图,对待处理信息进行第一次槽位信息提取,得到待处理信息包括的第一槽位集。

在本申请这一实施例中,对待处理信息进行第一次槽位信息提取,得到的第一槽位集可以包括针对目标意图需要填充的槽的槽位标签,还可以包括待处理信息中所包括的与槽位标签对应的槽位词汇。例如:待处理信息的文本内容为“我可能过两天要去别的地方出差,嗯……然后,估计要在深圳待几天,穿什么有推荐吗?”,第一槽位集可以包括针对待处理信息的目标意图“查询天气”需要填充的槽位标签“city”,还可以包括槽位标签“city”对应的槽位词汇“深圳”。

在本申请这一实施例中,槽位信息的识别实质上是nlp中的实体识别过程,可以采用通用的实体识别的方法来实现对待处理信息中槽位信息的识别。例如:可以获取大量的语料,对所获取的语料中所包括的实体进行标注,利用神经网络算法,进行槽位信息提取模型的训练。然后利用训练的模型对待处理信息中的槽位信息进行提取。

在操作104,基于目标意图和第一槽位集,对待处理信息进行第二次槽位信息提取,得到待处理信息包括的第二槽位集。

在本申请这一实施例中,由于第一次槽位信息提取过程中,容易存在遗漏的槽位信息。例如:针对待处理信息“我可能过两天要去别的地方出差,嗯……然后,估计要在深圳待几天,穿什么有推荐吗?”,在第一次槽位提取过程中,只提取到了槽位标签“city”以及相应的槽位词汇“深圳”,但是待处理信息中所包含的槽位标签“date”以及与该槽位标签相对应的槽位词汇“过两天”被遗漏了。

在本申请这一实施例中,可以利用与第一次槽位提取过程中所使用的同样的模型结构,训练得到一个在遗漏部分槽位信息的情况下再次进行槽位信息提取的召回层模型。然后,基于第一次槽位提取的结果,利用召回层模型,进行第二次槽位提取。

在操作105,根据第一槽位集和第二槽位集,确定待处理信息的信息识别结果。

在本申请这一实施例中,采用以下操作步骤实现根据第一槽位集和第二槽位集,确定待处理信息的信息识别结果:对第一槽位集和槽位集进行合并,得到槽位标签集合和槽位词汇集合,然后对槽位标签集合和槽位词汇集合进行去重处理,得到信息识别结果。

举例说明,待处理信息为“我可能过两天要去别的地方出差,嗯……然后,估计要在深圳待几天,穿什么有推荐吗?”,第一次槽位集包括{[city,深圳]},第二槽位集包括{[date,过两天],[city,深圳]},则信息识别结果为{[date,过两天],[city,深圳]}。

图2示出了本申请另一实施例信息识别方法的实现流程示意图。

参考图2,本申请实施例另一实施例信息识别方法,至少包括如下操作流程:

操作201,接收待处理信息。

在本申请这一实施例中,均以待处理信息为“我可能过两天要去别的地方出差,然后估计要在a地待几天,穿什么有推荐吗”为例,对本申请这一实施例的操作步骤进行说明。

操作202,对待处理信息进行意图识别,得到待处理信息的目标意图。

在本申请这一实施例中,参考上述图1中的操作102,可以得到待处理信息的目标意图为“查询天气”。

操作203,根据目标意图,对待处理信息进行第一次槽位信息提取,得到待处理信息包括的第一槽位集。

在本申请这一实施例中,在对待处理信息进行第一次槽位信息提取,得到待处理信息包括的第一槽位集的过程中,可能存在槽位信息的遗漏。因此,本申请中对槽位信息进行了第二次提取。并且,在基于目标意图和第一槽位集,对待处理信息进行第二次槽位信息提取之前,还获取若干个训练语料,训练语料包括语句内容、语句内容的意图信息和槽位标签信息;根据语句内容、意图信息和槽位标签信息,训练第一槽位信息提取模型,以对待处理信息进行第一次槽位信息提取。

在本申请另一实施例中,还对槽位标签信息的至少部分槽位标签进行模糊化处理,得到槽位标注结果;根据语句内容、意图标注结果和槽位标注结果,训练第二槽位信息提取模型,以对待处理信息进行第二次槽位信息提取。图3示出了本申请这一实施例信息识别方法的第二槽位信息提取模型的模型结构示意图。

在本申请这一实施例中,操作204~操作209采用第二槽位信息提取模型实现,图3示出了本申请这一实施例信息识别方法的第二槽位信息提取模型的模型结构示意图。因此,操作204~操作209的具体操作将在图3中结合模型结构具体说明。此处不再赘述。

操作204,根据第一槽位集,对待处理信息进行特征提取,得到第二次槽位特征提取的输入特征向量。

在本申请这一实施例中,输入特征向量包括待处理信息包括的字的字向量、位置向量和槽位标签向量。相应的,可以采用以下操作实现根据第一槽位集,对待处理信息进行特征提取,得到第二次槽位特征提取的输入特征向量:根据第一槽位集包括的第一槽位标签信息,确定待处理信息包括的字的槽位标签向量,并确定待处理信息的字的字向量和位置向量。其中,位置向量用于示出待处理信息中的每一个字在待处理信息中的位置。

操作205,对输入特征向量进行拼接,得到拼接向量;对拼接向量进行降维处理,得到编码向量。

操作206,对待处理信息进行语义分析,得到语义分析结果。

在本申请这一实施例中,对待处理信息进行语义分析包括:对待处理信息进行句法构造和依存关系分析中的至少之一。例如:“我后天要去杭州出差,那边适合什么衣服”,对其进行句法构造可以确定“我”是主语、“去”是谓语等。

操作207,根据语义分析结果,确定待处理信息的字的语义向量。

操作208,根据目标意图,确定待处理信息的字的意图向量。

操作209,对编码向量、语义向量和意图向量进行归一化处理,得到待处理信息包括的第二槽位集。

操作210,根据第一槽位集和第二槽位集,确定待处理信息的信息识别结果。

其中,操作201、202、203和210的具体实现过程与图1所示实施例中操作101、102、103和104的具体实现过程相类似,这里不再赘述。

图3示出了本申请这一实施例信息识别方法的第二槽位信息提取模型的模型结构示意图。

参考图3,对第二槽位信息提取模型的模型训练和应用过程做简单说明。如图3所示,在模型训练过程中,首先获取若干个训练语料,训练语料包括语句内容、语句内容的意图信息和槽位标签信息。例如:(1)、语句内容:我想听周杰伦的双节棍;语句内容的意图信息:播放音乐;槽位标签信息:槽位词汇“周杰伦”对应槽位标签“singer”,槽位词汇“双节棍”对应槽位标签“song”。(2)语句内容:我后天要去杭州出差;语句内容的意图信息:查询天气;槽位标签信息:槽位词汇“后天”对应槽位标签“date”,槽位词汇“杭州”对应槽位标签“city”,槽位词汇“衣服”对应槽位标签“dressingindex”。

在本申请这一实施例中,对槽位标签信息的至少部分槽位标签进行模糊化处理,得到槽位标注结果。这里可以采用随机抽取的方式,对槽位标签信息中的至少部分标签进行掩蔽处理,得到槽位标注结果。例如:对槽位标签信息的至少部分槽位标签进行模糊化处理后,语句(1)中的槽位词汇“双节棍”对应槽位标签“song”被mask(掩蔽),语句(2)中的槽位词汇“杭州”对应槽位标签“city”被mask。经过模糊化处理后,对训练语料进行特征提取,得到的语句(1)中的每个字的槽位标签向量分别为“e0、e0、e0、esinger、esinger、esinger、e0、e0、e0、e0”,位置向量分别为“e0、e1、e2、e3、e4、e5、e6、e7、e8、e9”,字向量分别为“e我、e想、e听、e周、e杰、e伦、e的、e双、e截、e棍”。同样的,可以得到语句(2)中的每个字的槽位标签向量、位置向量和字向量。如此,对所获取的训练语料均进行特征提取后,得到所有训练语料的输入特征向量,并针对每一训练语料的输入特征向量进行加权拼接,得到拼接向量。这里,对输入特征向量进行拼接,在对训练语料的槽位标签向量、位置向量和字向量进行加权拼接的过程中,初始的加权值可以是平均设定的,例如:字向量、位置向量和槽位标签向量分别占比1/3,随着训练语料的数量增加,加权拼接的加权值趋于稳定,作为最终的模型参数。

进一步的,将拼接向量输入transformerencoder(解码器)进行降维处理,得到降维处理结果。并引入训练语料的依存关系,构造训练语料的句法关系。这里依存关系和构造句法关系采用通用的nlp中的语义分析方法即可实现。对训练语料的依存关系、构造的训练语料的句法关系和降维处理结果进行归一化处理。这里归一化处理,可以采用softmax函数,也可以采用其他适用的归一化处理函数,最终得到训练语料中的字为槽位词汇的概率值,并确定概率值大于设定阈值为槽位词汇。经过多次训练过程,直至模型识别出对训练语料进行模糊化处理过程中掩蔽的槽位标签和槽位词汇大于设定识别率。说明模型的准确度达到预期。

以待处理信息为“我可能过两天要去别的地方出差,然后估计要在a地待几天,穿什么有推荐吗”为例,说明利用训练得到的第二槽位信息提取模型,对待处理信息进行第二次槽位信息提取的过程。

在本申请这一实施例中,第一次槽位提取结果中,仅识别出“a地”的槽位标签为“city”,由此,根据第一次槽位提取结果,对待处理信息进行特征提取,确定待处理信息的槽位标签向量为“e0、e0、e0、e0、e0、e…、ecity、ecity、e…”,位置向量分别为“e0、e1、e2、e3、e4、e…、e22、e23、e…”,字向量分别为“e我、e可、e能、e过、e两、e……、ea、e地、e…”,将槽位标签向量、位置向量和字向量进行加权拼接之后输入transformerencoder。

进一步的,对待处理信息进行语义分析,具体包括对待处理信息构造句法操作,并确定待处理信息的依存关系。将语义分析的结果和transformerencoder的输出,进行归一化处理,得到待处理信息中字为槽位词汇的概率,并确定相应的槽位标签。例如:最终确定“过两天”为槽位词汇的概率为78%,大于设定阈值70%。由此确定“过两天”为槽位词汇,并且“过两天”为时间信息,槽位标签为“date”。由此,成功召回第一次槽位提取过程中遗漏的槽位标签“date”和相应的槽位词汇“过两天”。

本申请实施例信息处理方法及装置,在接收到待处理信息后,首先,对待处理信息进行意图识别,得到待处理信息的目标意图;其次,根据目标意图,对待处理信息进行第一次槽位信息提取,得到待处理信息包括的第一槽位集;并且,基于目标意图和第一槽位集,对待处理信息进行第二次槽位信息提取,得到待处理信息包括的第二槽位集;最后,根据第一槽位集和第二槽位集,确定待处理信息的信息识别结果。由此,第二次槽位信息提取过程的设计能够充分的利用各个槽位间的关系、主题信息以及结构信息等,有效召回第一次槽位信息提取过程中所遗漏的槽位,增加槽位信息提取准确率和效率。从而,有效减少信息交互过程中的交流轮次,显著提升用户体验。

同理,基于上文信息处理方法,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有程序,当程序被处理器执行时,使得处理器至少执行如下的操作步骤:操作101,接收待处理信息;操作102,对待处理信息进行意图识别,得到待处理信息的目标意图;操作103,根据目标意图,对待处理信息进行第一次槽位信息提取,得到待处理信息包括的第一槽位集;操作104,基于目标意图和第一槽位集,对待处理信息进行第二次槽位信息提取,得到待处理信息包括的第二槽位集;操作105,根据第一槽位集和第二槽位集,确定待处理信息的信息识别结果。

进一步,基于如上文信息方法,本申请实施例还提供一种信息识别装置,如图40,该装置40包括:接收模块401,用于接收待处理信息;意图识别模块402,用于对待处理信息进行意图识别,得到待处理信息的目标意图;第一提取模块403,用于根据目标意图,对待处理信息进行第一次槽位信息提取,得到待处理信息包括的第一槽位集;第二提取模块404,用于基于目标意图和第一槽位集,对待处理信息进行第二次槽位信息提取,得到待处理信息包括的第二槽位集;信息处理模块405,用于根据第一槽位集和第二槽位集,确定待处理信息的信息识别结果。

根据本申请的另一实施例,第二提取模块404包括:向量提取子模块,用于根据第一槽位集,对待处理信息进行特征提取,得到第二次槽位特征提取的输入特征向量;槽位提取子模块,用于对输入特征向量进行槽位信息提取,得到第二槽位集。

根据本申请的另一实施例,输入特征向量包括待处理信息包括的字的字向量、位置向量和槽位标签向量;相应的,向量提取子模块根据第一槽位集,对待处理信息进行特征提取,得到第二次槽位特征提取的输入特征向量,包括:根据第一槽位集包括的第一槽位标签信息,确定待处理信息包括的字的槽位标签向量;确定待处理信息的字的字向量和位置向量;其中,位置向量用于示出待处理信息中的每一个字在待处理信息中的位置。

根据本申请的另一实施例,槽位提取子模块对输入特征向量进行槽位信息提取,得到待处理信息包括的第二槽位集,包括:对输入特征向量进行拼接,得到拼接向量;对拼接向量进行降维处理,得到编码向量;对待处理信息进行语义分析,得到语义分析结果;根据语义分析结果,确定待处理信息的字的语义向量;根据目标意图,确定待处理信息的字的意图向量;对编码向量、语义向量和意图向量进行归一化处理,得到待处理信息包括的第二槽位集。

根据本申请的另一实施例,对待处理信息进行语义分析,得到语义分析结果,包括:对待处理信息进行句法构造和依存关系分析中的至少之一,得到语义分析结果。

根据本申请的另一实施例,装置40还包括:获取模块,用于在基于目标意图和第一槽位集,对待处理信息进行第二次槽位信息提取之前,获取若干个训练语料,训练语料包括语句内容、语句内容的意图信息和槽位标签信息;第一训练模块,用于根据语句内容、意图信息和槽位标签信息,训练第一槽位信息提取模型,以对待处理信息进行第一次槽位信息提取。

根据本申请的另一实施例,装置40还包括:模糊处理模块,用于对槽位标签信息的至少部分槽位标签进行模糊化处理,得到槽位标注结果;第二训练模块,用于根据语句内容、意图标注结果和槽位标注结果,训练第二槽位信息提取模型,以对待处理信息进行第二次槽位信息提取。

根据本申请的另一实施例,模糊处理模块包括:掩蔽子模块,用于采用随机抽取的方式,对槽位标签信息中的至少部分标签进行掩蔽处理,得到槽位标注结果。

根据本申请的另一实施例,信息处理模块405包括:槽位合并子模块,用于对第一槽位集和槽位集进行合并,得到槽位标签集合和槽位词汇集合;槽位去重子模块,用于对槽位标签集合和槽位词汇集合进行去重处理,得到信息识别结果。

这里需要指出的是:以上对针对信息处理装置实施例的描述,与前述图1至3所示的方法实施例的描述是类似的,具有同前述图1至3所示的方法实施例相似的有益效果,因此不做赘述。对于本申请信息处理装置实施例中未披露的技术细节,请参照本申请前述图1至3所示的方法实施例的描述而理解,为节约篇幅,因此不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(readonlymemory,rom)、磁碟或者光盘等各种可以存储程序代码的介质。

或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、磁碟或者光盘等各种可以存储程序代码的介质。

以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。


技术特征:

1.一种信息处理方法,所述方法包括:

接收待处理信息;

对所述待处理信息进行意图识别,得到所述待处理信息的目标意图;

根据所述目标意图,对所述待处理信息进行第一次槽位信息提取,得到所述待处理信息包括的第一槽位集;

基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集;

根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果。

2.根据权利要求1所述的方法,基于所述目标意图信息和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集,包括:

根据所述第一槽位集,对所述待处理信息进行特征提取,得到第二次槽位特征提取的输入特征向量;

对所述输入特征向量进行槽位信息提取,得到所述第二槽位集。

3.根据权利要求2所述的方法,所述输入特征向量包括所述待处理信息包括的字的字向量、位置向量和槽位标签向量;

相应的,所述根据所述第一槽位集,对所述待处理信息进行特征提取,得到第二次槽位特征提取的输入特征向量,包括:

根据所述第一槽位集包括的第一槽位标签信息,确定所述待处理信息包括的字的槽位标签向量;

确定所述待处理信息的字的字向量和位置向量;

其中,所述位置向量用于示出所述待处理信息中的每一个字在所述待处理信息中的位置。

4.根据权利要求2所述的方法,对所述输入特征向量进行槽位信息提取,得到所述待处理信息包括的第二槽位集,包括:

对所述输入特征向量进行拼接,得到拼接向量;

对所述拼接向量进行降维处理,得到编码向量;

对所述待处理信息进行语义分析,得到语义分析结果;

根据所述语义分析结果,确定所述待处理信息的字的语义向量

根据所述目标意图,确定所述待处理信息的字的意图向量;

对所述编码向量、所述语义向量和所述意图向量进行归一化处理,得到所述待处理信息包括的第二槽位集。

5.根据权利要求4所述的方法,所述对所述待处理信息进行语义分析,得到语义分析结果,包括:

对所述待处理信息进行句法构造和依存关系分析中的至少之一,得到所述语义分析结果。

6.根据权利要求1所述的方法,在基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取之前,所述方法还包括:

获取若干个训练语料,所述训练语料包括语句内容、所述语句内容的意图信息和槽位标签信息;

根据所述语句内容、所述意图信息和所述槽位标签信息,训练第一槽位信息提取模型,以对所述待处理信息进行第一次槽位信息提取。

7.根据权利要求6所述的方法,所述方法还包括:

对所述槽位标签信息的至少部分槽位标签进行模糊化处理,得到槽位标注结果;

根据所述语句内容、所述意图标注结果和所述槽位标注结果,训练第二槽位信息提取模型,以对所述待处理信息进行第二次槽位信息提取。

8.根据权利要求7所述的方法,对所述槽位标签信息的至少部分槽位标签进行模糊化处理,得到槽位标注结果,包括:

采用随机抽取的方式,对所述槽位标签信息中的至少部分标签进行掩蔽处理,得到所述槽位标注结果。

9.根据权利要求1-8中任一项所述的方法,所述根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果,包括:

对所述第一槽位集和所述槽位集进行合并,得到槽位标签集合和槽位词汇集合;

对所述槽位标签集合和所述槽位词汇集合进行去重处理,得到所述信息识别结果。

10.一种信息识别装置,所述装置包括:

接收模块,用于接收待处理信息;

意图识别模块,用于对所述待处理信息进行意图识别,得到所述待处理信息的目标意图;

第一提取模块,用于根据所述目标意图,对所述待处理信息进行第一次槽位信息提取,得到所述待处理信息包括的第一槽位集;

第二提取模块,用于基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集;

信息处理模块,用于根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果。

技术总结
本申请公开了一种信息处理方法及装置,在接收到待处理信息后,首先,对待处理信息进行意图识别,得到待处理信息的目标意图;其次,根据目标意图,对待处理信息进行第一次槽位信息提取,得到待处理信息包括的第一槽位集;并且,基于目标意图和第一槽位集,对待处理信息进行第二次槽位信息提取,得到待处理信息包括的第二槽位集;最后,根据第一槽位集和第二槽位集,确定待处理信息的信息识别结果。如此,增加第二次槽位信息提取过程,充分的利用各个槽位之间的关系、主题信息以及结构信息等,有效召回第一次槽位信息提取过程中所遗漏的槽位,有效增加槽位信息提取的准确率和效率。从而,有效减少信息交互过程中的交流轮次,显著提升用户体验。

技术研发人员:张东海;卓雷
受保护的技术使用者:联想(北京)有限公司
技术研发日:2021.03.29
技术公布日:2021.08.03

转载请注明原文地址:https://doc.8miu.com/read-7774.html

最新回复(0)