证件识别方法、装置、存储介质及电子设备与流程

专利2025-11-03  14


本发明涉及图像视觉领域,以及文本识别领域,具体而言,涉及一种证件识别方法、装置、存储介质及电子设备。


背景技术:

1、证件识别技术作为一种应用广泛的人工智能,在诸多领域都发挥着不可或缺的作用。证件识别模型需要时常更新的需求,随着证件种类的不断增加以及识别需求的日益复杂,相关技术中模型必须不断地进行适应和优化。然而,频繁的更新不仅意味着巨大的时间和资源投入,还可能影响到系统的稳定性和可用性,相关技术重新训练不仅需要大量的标注数据,还需要耗费大量的计算资源。相关技术还受限于功能暂停进行线下更新,难以匹配不接受服务中断的应用需求,存在应用局限性较大。

2、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本发明实施例提供了一种证件识别方法、装置、存储介质及电子设备,以至少解决相关技术中存在证件识别准确性难以在线提升的技术问题。

2、根据本发明实施例的一个方面,提供了一种证件识别方法,包括:将目标证件的图像数据,输入第一模型进行文字识别,得到第一文本特征;采用第二模型,对所述第一文本特征进行语义矫正,得到第二文本特征,其中,所述第二模型的参数量大于所述第一模型的参数量,所述第二模型的文字识别能力优于所述第一模型的文字识别能力;确定所述第二文本特征的矫正结果,在所述矫正结果高于预定结果阈值的情况下,基于所述第二文本特征,得到所述目标证件的目标识别结果,并对所述第一模型基于所述第二文本特征进行再训练,得到更新后的第一模型。

3、可选地,训练所述第一模型的训练集包括预定类型的文本内容,所述对所述第一模型基于所述第二文本特征进行再训练,得到更新后的第一模型,包括:确定所述目标证件中包括的目标内容为目标类型的文本内容;在所述目标类型与所述预定类型不同的情况下,保持所述第一模型的参数配置,并将所述第二文本特征输入所述第一模型,得到中间特征;将所述中间特征,输入用于特征加权融合的预定层,得到第三文本特征;对所述第二文本特征和所述第三文本特征进行合并,得到合并特征;基于所述合并特征,对所述预定层的参数配置进行更新,得到更新后的预定层;基于所述更新后的预定层和所述第一模型,得到所述更新后的第一模型。

4、可选地,所述对所述第二文本特征和所述第三文本特征进行合并,得到合并特征,包括:确定所述目标内容中包括的多个文字分别属于第一文字类型的第一置信度,以及所述多个文字分别属于第二文字类型的第二置信度,其中,所述第一文字类型为对应文字基于所述第二文本特征得到的文字类型,所述第二文字类型为对应文字基于所述第三文本特征得到的文字类型;确定所述多个文字中所述第一文字类型与所述第二文字类型不匹配的目标文字;在所述第一置信度大于所述第二置信度的情况下,确定所述目标文字为所述第一文字类型,作为所述合并特征;或者,在所述第二置信度大于所述第一置信度的情况下,确定所述目标文字为所述第二文字类型,作为所述合并特征。

5、可选地,所述方法还包括:在所述目标类型与所述预定类型相同的情况下,基于所述第二文本特征,对所述第一模型的参数配置进行更新,得到所述更新后的第一模型。

6、可选地,所述确定所述第二文本特征的矫正结果,包括:对所述第二文本特征进行分词处理,得到多个分词结果;确定所述多个分词结果分别与预定词库的匹配结果;基于所述多个分词结果分别对应的匹配结果,确定所述矫正结果。

7、可选地,所述方法还包括:确定所述目标证件对应的证件类型;获取与所述证件匹配的多个同类证件分别对应的证件信息;基于所述多个同类证件分别对应的证件信息,生成所述预定词库。

8、可选地,所述方法还包括:在所述矫正结果低于所述预定评分阈值的情况下,基于所述第一文本特征,得到所述目标识别结果,并保持所述第一模型的参数配置。

9、根据本发明实施例的另一方面,提供了一种证件识别装置,包括:文字识别模块,用于将目标证件的图像数据,输入第一模型进行文字识别,得到第一文本特征;语义矫正模块,用于采用第二模型,对所述第一文本特征进行语义矫正,得到第二文本特征,其中,所述第二模型的参数量大于所述第一模型的参数量,所述第二模型的文字识别能力优于所述第一模型的文字识别能力;结果输出模块,用于确定所述第二文本特征的矫正结果,在所述矫正结果高于预定结果阈值的情况下,基于所述第二文本特征,得到所述目标证件的目标识别结果,并对所述第一模型基于所述第二文本特征进行再训练,得到更新后的第一模型。

10、根据本发明实施例的另一方面,提供了一种非易失性存储介质,所述非易失性存储介质存储有多条指令,所述指令适于由处理器加载并执行任意一项所述的证件识别方法。

11、根据本发明实施例的另一方面,提供了一种电子设备,包括:一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现任意一项所述的证件识别方法。

12、在本发明实施例中,通过将目标证件的图像数据,输入第一模型进行文字识别,得到第一文本特征;采用第二模型,对所述第一文本特征进行语义矫正,得到第二文本特征,其中,所述第二模型的参数量大于所述第一模型的参数量,所述第二模型的文字识别能力优于所述第一模型的文字识别能力;确定所述第二文本特征的矫正结果,在所述矫正结果高于预定结果阈值的情况下,基于所述第二文本特征,得到所述目标证件的目标识别结果,并对所述第一模型基于所述第二文本特征进行再训练,得到更新后的第一模型。达到了利用其他模型的识别能力提升证件识别模型的识别能力的目的,实现了减少证件识别能力提升的局限性的技术效果,进而解决了相关技术中存在证件识别准确性难以在线提升的技术问题。



技术特征:

1.一种证件识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,训练所述第一模型的训练集包括预定类型的文本内容,所述对所述第一模型基于所述第二文本特征进行再训练,得到更新后的第一模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述第二文本特征和所述第三文本特征进行合并,得到合并特征,包括:

4.根据权利要求2所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述确定所述第二文本特征的矫正结果,包括:

6.根据权利要求5所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1至6中任意一项所述的方法,其特征在于,所述方法还包括:

8.一种证件识别装置,其特征在于,包括:

9.一种非易失性存储介质,其特征在于,所述非易失性存储介质存储有多条指令,所述指令适于由处理器加载并执行权利要求1至7中任意一项所述的证件识别方法。

10.一种电子设备,其特征在于,包括:一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的证件识别方法。


技术总结
本发明公开了一种证件识别方法、装置、存储介质及电子设备。其中,该方法包括:将目标证件的图像数据,输入第一模型进行文字识别,得到第一文本特征;采用第二模型,对第一文本特征进行语义矫正,得到第二文本特征,其中,第二模型的参数量大于第一模型的参数量,第二模型的文字识别能力优于第一模型的文字识别能力;确定第二文本特征的矫正结果,在矫正结果高于预定结果阈值的情况下,基于第二文本特征,得到目标证件的目标识别结果,并对第一模型基于第二文本特征进行再训练,得到更新后的第一模型。本发明解决了相关技术中存在证件识别准确性难以在线提升的技术问题。

技术研发人员:方徐伟
受保护的技术使用者:天翼电子商务有限公司
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1824368.html

最新回复(0)