一种防录音攻击身份认证方法、装置及系统与流程

专利2022-05-09  166



1.本发明属于声纹识别领域,具体涉及一种防录音攻击身份认证方法、装置及系统。


背景技术:

2.说话人识别作为一种生物识别技术的一种,具有简单、高效、便捷的特点,其主要原理是基于语音信息中包含了能够表征说话人特性的信息,通过计算机及信号处理技术,可以自动的判定说话人的身份。近年来,随着信息技术的飞速发展,语音信号作为一种非接触式的身份信息载体,人们可以随时对地的通过各种移动终端设备对语音信息进行采集,通过现今广泛存在的移动网络快速的传输到后台的服务器,通过运算,实现便捷的身份认证。
3.现有技术中,如图1所示为传统说话人识别系统的框架图。图2为录音重放攻击说话人认证系统的流程图,其中,(一)为用户读取密令文本,经过系统判定是否是本人。(二)为认证用户在认证的过程中,密令文本被录音。(三)是攻击者拿图二录取的含有密令的音频片段来攻击说话人认证系统。
4.当前说话人识别技术已广泛的应用到各种身份认证的场景中,但在一些场景中,存在风险因素:说话人的声音容易被录音,然后使用录音攻击认证系统,在金融支付场景、门禁认证场景中被录音重放攻击,存在重大风险问题。


技术实现要素:

5.为了解决现有技术存在的认证系统存在重大风险的问题,本发明实施例提供以下技术方案:
6.第一方面,一种防录音攻击身份认证方法,其特征在于,包括:
7.向待验证用户发送密令文本;
8.获取待验证用户读取所述密令文本的音频信号;
9.判断所述音频信号是否包含预设频率的低频信号,若所述音频信号中包含所述预设频率的低频信号,则判断为录音重放,验证不通过;
10.若所述音频信号中不包含所述预设频率的低频信号,则判断为不是录音重放,并进行常规认证;
11.在等待获取待验证用户读取密令文本的音频信号时,播放预设频率的低频信号。
12.进一步地,对所述音频信号进行低频信号检测,包括:
13.对所述音频信号的进行特征提取,得到特征提取结果;
14.根据所述特征提取结果,对所述特征提取结果进行低频信号检测。
15.进一步地,若所述音频信号中不包含所述预设频率的低频信号,则判断为不是录音重放,并进行常规认证,所述常规认证包括:
16.判断所述音频信号是否是说话人,得到判断结果;
17.若所述判断结果为说话人,则通过认证;
18.若所述判断结果为非说话人,则拒绝通过认证。
19.进一步地,所述判断所述音频信号是否是说话人,得到判断结果,包括:
20.将所述音频信号与注册语音进行对比,根据预设阈值对说音频信号打分,得到打分结果;
21.若所述打分结果高于预设阈值,则判断所述音频信号为说话人;
22.若所述打分结果低于预设阈值,则判断所述音频信号为非说话人。
23.进一步地,所述音频信号包括时间信息和位置信息。
24.第二方面,一种防录音攻击身份认证装置,包括:
25.发送模块,用于向待验证用户发送密令文本;
26.获取模块,用于获取待验证用户读取所述密令文本的音频信号;
27.加密低频信号检测模块,用于对所述音频信号进行低频信号检测;
28.判断模块,用于判断所述音频信号是否包含加密低频信号,若所述音频信号中包含所述加密低频信号,则判断为录音重放,验证不通过;
29.若所述音频信号中不包含所述加密低频声波,则判断为不是录音重放,并进行常规认证;
30.低频信号播放模块,用于在获取获取待验证用户取密令文本的音频信号时,播放预设频率的低频信号;
31.回声消除模块,用于消除当前低频信号播放模块播放的低频信号。
32.第三方面,一种防录音攻击身份认证系统,包括一种防录音攻击身份认证装置。
33.本发明实施例提供的一种防录音攻击身份认证方法、装置及系统,包括:通过获取待验证用户取密令文本的音频信号;对音频信号进行低频信号检测;判断音频信号是否包含预设频率的低频信号,若音频信号中包含预设频率的低频信号,则判断为录音重放,验证不通过;若音频信号中不包含预设频率的低频信号,则判断为不是录音重放,并进行常规认证;在获取获取待验证用户取密令文本的音频信号时,播放预设频率的低频信号。本发明将加低频加密声波技术融入到身份认证中,来增强防录音攻击技术,有效的提升了声纹身份认证方法的可靠性且具有隐蔽性、便捷性、低成本。
附图说明
34.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
35.图1是传统说话人识别系统的框架图。
36.图2是录音重放攻击说话人认证系统的流程图。
37.图3是本发明实施例中一种防录音攻击身份认证方法步骤图。
38.图4是本发明实施例中一种防录音攻击身份认证装置结构图。
39.附图标记:
[0040]1‑
发送模块;2

获取模块;3

加密低频信号检测模块;4

判断模块;5

低频信号播放模块;6

回声消除模块。
具体实施方式
[0041]
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
[0042]
如图3所示,为本发明一个实施例中一种防录音攻击身份认证方法步骤图,包括:
[0043]
步骤s11、向待验证用户发送密令文本;
[0044]
步骤s12、获取待验证用户读取密令文本的音频信号;
[0045]
步骤s13、对音频信号进行低频信号检测;
[0046]
步骤s14、判断音频信号是否包含预设频率的低频信号,
[0047]
步骤s15、若音频信号中包含预设频率的低频信号,则判断为录音重放,验证不通过;
[0048]
步骤s16、若音频信号中不包含预设频率的低频信号,则判断为不是录音重放,并进行常规认证;
[0049]
其中,在等待获取待验证用户读取密令文本的音频信号时,播放预设频率的低频信号。
[0050]
需要说明的是,由于人耳对声音频率的感知范围大致在500

4000hz范围内,也就是说超过或者低于这个频率范围,人耳不易感知到,如果播放低于这个频率范围内的声波,由于超过人耳感知范围内,具有隐蔽性。
[0051]
所以,本申请采用播放预设频率的低频信号,使得人耳感知不到。
[0052]
可以理解为,本发明实施例提供的一种防录音攻击身份认证方法包括:通过获取待验证用户取密令文本的音频信号;对音频信号进行低频信号检测;判断音频信号是否包含预设频率的低频信号,若音频信号中包含预设频率的低频信号,则判断为录音重放,验证不通过;若音频信号中不包含预设频率的低频信号,则判断为不是录音重放,并进行常规认证;在获取获取待验证用户取密令文本的音频信号时,播放预设频率的低频信号。本发明将加低频加密声波技术融入到身份认证中,来增强防录音攻击技术,有效的提升了声纹身份认证方法的可靠性且具有隐蔽性、便捷性、低成本。
[0053]
作为上述方法的进一步改进,一些实施例中,
[0054]
对音频信号进行低频信号检测,包括:
[0055]
对音频信号的进行特征提取,得到特征提取结果;
[0056]
根据特征提取结果,对特征提取结果进行低频信号检测。
[0057]
在一个实施例中,若音频信号中不包含预设频率的低频信号,则判断为不是录音重放,并进行常规认证,常规认证包括:
[0058]
判断音频信号是否是说话人,得到判断结果;
[0059]
若判断结果为说话人,则通过认证;
[0060]
若判断结果为非说话人,则拒绝通过认证。
[0061]
一些实施例中,判断音频信号是否是说话人,得到判断结果,包括:
[0062]
将音频信号与注册语音进行对比,根据预设阈值对说音频信号打分,得到打分结果;
[0063]
若打分结果高于预设阈值,则判断音频信号为说话人;
[0064]
若打分结果低于预设阈值,则判断音频信号为非说话人。
[0065]
需要说明的是,说话人识别是指利用已知的音频、语音信息,确认说话人身份。主要分为说话人确认和说话人辨认:
[0066]
说话人辨认(automatic speaker identification):从一群人中,确认是否有a同学讲的话;
[0067]
说话人确认(automatic speaker verification):确认是否是a同学讲的话。
[0068]
说话人识别俗称“声纹识别”,是生物识别技术中的一种,和指纹识别、虹膜识别一样,因为这些生物特征具有唯一性和稳定性,所以主要被运用在身份验证场景中。比如公安机关提取到电信诈骗案录音线索后,可以使用声纹识别技术判断是否是在逃人员或再犯人员;智能手机上使用声纹识别技术可以和指纹一样,验证解锁。
[0069]
一些实施例中,音频信号包括时间信息和位置信息。
[0070]
本系统对说话人音频的识别还包括解析音频中的时间信息和位置信息,来增强防录音攻击技术,有效的提升了声纹身份认证方法的可靠性。
[0071]
如图4所示,为本发明一个实施例中一种防录音攻击身份认证装置结构图,包括:
[0072]
发送模块1,用于向待验证用户发送密令文本;
[0073]
获取模块2,用于获取待验证用户读取密令文本的音频信号;
[0074]
加密低频信号检测模块3,用于对音频信号进行低频信号检测;
[0075]
判断模块4,用于判断音频信号是否包含加密低频信号,若音频信号中包含加密低频信号,则判断为录音重放,验证不通过;
[0076]
若音频信号中不包含加密低频声波,则判断为不是录音重放,并进行常规认证;
[0077]
低频信号播放模块5,用于在获取获取待验证用户取密令文本的音频信号时,播放预设频率的低频信号;
[0078]
回声消除模块6,用于消除当前低频信号播放模块播放的低频信号。
[0079]
可以理解为,本发明是在应用设备上单独安装低频信号播放模块,在使用过程中该低频信号播放模块持续播放预设频率的低频信号。用户在读取密令,音频信号输入到系统中后,经过低频声波检测过程,如果检测到输入的音频信号中存在过往预设频率的低频信号,则判定为录音重放,如未检测到,再经过常规认证流程,判定是否是说话人。
[0080]
用户在输入音频时,本身设备也在播放低频声波,为防止这种声波被系统误识别为录音。所以本申请还增加了回声消除模块,回声消除模块为硬件模块,回声消除模块可以抵消系统本身发出的低频声波,有效避免系统误判。
[0081]
相对于常规的身份认证流程,本发明所提供的一种防录音攻击身份认证装置中增加了三个模块,一个是低频信号播放模块,一个是加密低频信号检测模块,一个回声消除模块,来消除当前播放机密信号,低频信号检测模块只检测历史加密信号而忽略当前播放出的加密信号对系统的影响。如检测到有音频中有历史加密低频信号,则认为录音重放,直接判定认证失败。
[0082]
本发明还提供了一种防录音攻击身份认证系统,包括一种防录音攻击身份认证装置。
[0083]
本发明提供一种防录音攻击身份认证系统,基于低频加密声波水印的防录音攻击
身份认证方法,区别于传统的身份认证方法,本发明将低频加密声波技术融入到身份认证中,来增强防录音攻击技术,有效的提升了声纹身份认证方法的可靠性且具有隐蔽性、便捷性、低成本。
[0084]
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
[0085]
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
[0086]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
[0087]
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0088]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0089]
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0090]
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0091]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0092]
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

技术特征:
1.一种防录音攻击身份认证方法,其特征在于,包括:向待验证用户发送密令文本;获取待验证用户读取所述密令文本的音频信号;对所述音频信号进行低频信号检测;判断所述音频信号是否包含预设频率的低频信号,若所述音频信号中包含所述预设频率的低频信号,则判断为录音重放,验证不通过;若所述音频信号中不包含所述预设频率的低频信号,则判断为不是录音重放,并进行常规认证;其中,在等待获取待验证用户读取密令文本的音频信号时,播放预设频率的低频信号。2.根据权利要求1所述的方法,其特征在于,对所述音频信号进行低频信号检测,包括:对所述音频信号的进行特征提取,得到特征提取结果;根据所述特征提取结果,对所述特征提取结果进行低频信号检测。3.根据权利要求1所述的方法,其特征在于,若所述音频信号中不包含所述预设频率的低频信号,则判断为不是录音重放,并进行常规认证,所述常规认证包括:判断所述音频信号是否是说话人,得到判断结果;若所述判断结果为说话人,则通过认证;若所述判断结果为非说话人,则拒绝通过认证。4.根据权利要求3所述的方法,其特征在于,所述判断所述音频信号是否是说话人,得到判断结果,包括:将所述音频信号与注册语音进行对比,根据预设阈值对音频信号打分,得到打分结果;若所述打分结果高于预设阈值,则判断所述音频信号为说话人;若所述打分结果低于预设阈值,则判断所述音频信号为非说话人。5.根据权利要求1所述的方法,其特征在于,所述音频信号包括时间信息和位置信息。6.一种防录音攻击身份认证装置,其特征在于,包括:发送模块,用于向待验证用户发送密令文本;获取模块,用于获取待验证用户读取所述密令文本的音频信号;加密低频信号检测模块,用于对所述音频信号进行低频信号检测;判断模块,用于判断所述音频信号是否包含加密低频信号,若所述音频信号中包含所述加密低频信号,则判断为录音重放,验证不通过;若所述音频信号中不包含所述加密低频声波,则判断为不是录音重放,并进行常规认证;低频信号播放模块,用于在获取获取待验证用户取密令文本的音频信号时,播放预设频率的低频信号;回声消除模块,用于消除当前低频信号播放模块播放的低频信号。7.一种防录音攻击身份认证系统,其特征在于,包括如权利要求6所述的一种防录音攻击身份认证装置。
技术总结
本发明涉及声纹识别领域,具体涉及一种防录音攻击身份认证方法、装置及系统,包括:通过获取待验证用户取密令文本的音频信号;对音频信号进行低频信号检测;判断音频信号是否包含预设频率的低频信号,若音频信号中包含预设频率的低频信号,则判断为录音重放,验证不通过;若音频信号中不包含预设频率的低频信号,则判断为不是录音重放,并进行常规认证;在获取获取待验证用户取密令文本的音频信号时,播放预设频率的低频信号。本发明将低频加密声波技术融入到身份认证中,来增强防录音攻击技术,有效的提升了声纹身份认证方法的可靠性且具有隐蔽性、便捷性、低成本。低成本。低成本。


技术研发人员:杜文强 张明 关磊
受保护的技术使用者:常州分音塔科技有限公司
技术研发日:2021.03.04
技术公布日:2021/6/29

转载请注明原文地址:https://doc.8miu.com/read-258.html

最新回复(0)