一种基于超声波时域处理的重放攻击活体检测方法与流程
本发明属于语音安全领域,涉及语音信息处理、重放攻击检测和活体检测。本发明可应用于语音安全领域中的活体检测领域。
背景技术:
语音认证系统作为一种快捷方便的认证方式,已经应用于多种重要领域,因此语音安全成为了一个非常重要的课题,对语音认证系统的欺骗攻击检测也十分关键。在多种攻击中,重放攻击是最为常见的一种攻击,即利用用户录音对语音验证系统进行攻击,因此对重放攻击的检测有很大的现实意义。在多种检测攻击的方法中,活体检测因其检测方法直接,信息来源多样而被很多学者研究,有些基于活体检测的应用已经投入市场。而现有的重放攻击检测方法中大多是针对音频信号的处理并在频域进行信息提取和判断,导致算法复杂,判断准确率低;现有的少数利用活体检测机理进行重放攻击检测的方法大多采用较为复杂的硬件设备,且对用户的要求高,导致其很难投入实际应用。
技术实现要素:
为解决语音认证系统的重放攻击检测的安全性问题,本发明提出了一种基于超声波时域处理的重放攻击活体检测方法,有效解决了现有方法中硬件、算法复杂,检测准确性差、用户体验差等问题,达到检测重放攻击的目的,做到用户友好,硬件、算法简单,并能够应用于实际语音信号处理系统中。
本发明的技术方案如下:
本发明的一种基于超声波时域处理的重放攻击活体检测方法采用单个手机搭建检测平台,进行超声波发射、声音采样、信号处理以及相关性判断。该方法包括以下步骤:
步骤1:利用用户手机发射幅值、频率恒定,能量反射后经麦克风采样仍大于环境噪声10倍以上的超声波;
步骤2:利用用户手机采集超声波反射后的信号以及语音信号;
步骤3:对采集的声音样本进行处理,得到时间同步的高低频两组时域信号;所述的低频信号部分输出为单音节信号;
步骤4:对高频信号进行包络检波,并将包络线与低频语音信号作相关性判断,相关性大于阈值判定为用户,反之则判断为重放攻击者,其中阈值通过对用户和攻击者分别取足够样本进行相关性提取后深度学习得到。
上述技术方案中,进一步地,采用单一手机建立检测平台,进行声音采集、样本处理以及判断工作。
进一步地,所述的步骤3中,利用端点检测的方法确定低频信号各个音节的起始位置,并以此为依据截取样本中的有效片段,保证低频信号部分为单音节信号。
进一步地,所述步骤3包括以下子步骤:
步骤3.1:对采集样本进行有效性判断,具体实施方法为:对采集样本的幅值取有效值,并与设定的环境噪声幅值比较,要求大于环境噪声10倍以上;
步骤3.2:对采集样本进行采样率提取,并根据采样率是否大于100khz确定样本是否需要重采样;
步骤3.3:对采样率低于100khz的采集样本进行重采样;
步骤3.4:分析样本频谱,确定滤波频率;
步骤3.5:对重采样样本进行滤波,得到时间同步的高低频两组时域信号。
上述技术方案中,进一步地,所述步骤3.3中,所述的重采样为:首先进行fft变换,并在频谱中将样本在频域对采样率频率进行补零操作使其达到期望采样率频率,而后进行ifft变换。
进一步地,所述的步骤3.4具体为:分析所有样本频谱频率分布,在频域内通过端点检测判断有效低频信号的最高频率以及有效高频信号的最低频率,采用上述两个频率的平均值作为滤波频率。
进一步地,所述的步骤3.5中,所述的滤波采用理想低通滤波器和理想高通滤波器(即矩形窗函数),滤波过程依靠软件实现。
进一步地,所述步骤4中,所述的包络检波采用希尔伯特变换实现。
本发明有益效果是:
本发明利用活体检测的方法进行重放攻击检测,有效提高了检测的准确度,简化了算法,并对用户使用更为友好。
本发明采用单一手机进行检测平台的搭建,在不借助其它硬件设备的条件下实现了重放攻击的检测,推动重放攻击检测投入实际应用的进程。
附图说明
图1是本发明的检测平台示意图;
图2是本发明的步骤流程图;
图3是本发明的原理推导模型示意图;
图4是本发明实施例的重采样效果图;
图5是本发明实施例的对象为用户时的结果图;
图6是本发明实施例的对象为攻击者时的结果图。
具体实施方式
为了便于本领域普通技术人员理解和实施此发明,下面结合附图及实施例对本发明作进一步的详细阐述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
如图1所示,本发明利用一个具有超声波收发功能的手机实现重放攻击检测。用户或者攻击者与采样手机的水平距离固定为10cm。使用者为用户时,用户发声时脸部变化,导致超声波反射平面发生变化,从而致使反射的超声波部分幅值发生变化,该变化与采集到的用户发声音频存在一定相关性;使用者为欺骗者时,超声波反射平面在一定误差内(不考虑环境噪声以及欺骗者运动的情况下)认为保持不变,从而导致反射的超声波部分幅值基本不变,或者幅值变化与采集到的低频语音信号无关。本发明以上述相关性判定是否遭受重放攻击。
以下结合具体实施例对本发明进行详细分析和仔细说明,其中附有原理证明。
本发明提供一种基于超声波时域处理的重放攻击活体检测方法,包括以下步骤:
步骤1:发送连续超声波,为保证处理效果,发送频率为20khz超声波,并采用0db幅值。超声波遇到目标物体后产生回波,由于不同的材质对超声波的吸收程度不同以及不同位置相对发射点的角度不同,对应的超声波回波幅值不同;由于与超声波发射源距离不同,对应超声波的回波相位不同。下面考虑理想静态物体做出数学理论推导,模型示意图请见图1(上图为用户使用情况,下图为欺骗者使用情况)。本发明方法的步骤流程图如图2所示。
首先以两个不同位置为例,如图3所示,假设发送超声波为asinωt超声波传播到这两个位置时表达式为
当两不同位置的回波到达接收处时,经过空气传播又有一定衰减,同时也会产生一个新的相位,两接收到的回波的表达式分别为
r(t)=t1sinωt+t2cosωt
r(t)=bsin(ωt+θ)
实际会收到n个有衰减和相位移的回波,在上述推导基础上不难得到此时得到的回波是一个标准正弦波,其表达式如下:
上面分析得到理想静止目标物体反射的回波是一个标准正弦波,下面考虑动态目标物体,当物体动作时,会产生多普勒效应,即
接收到的回波是一个不同频率正弦叠加,表现为一个幅值随时间变化的高频信号。这个变化就体现出了动作物体的动态特征,也就是说回波的包络线就是想要提取的动态信息,由于动作频率有限,包络线的频率远小于超声波的频率。并且我们认为当嘴型变化较慢时,可以提取到在一段时间内包络线变化较小的样本片段。
步骤2:超声波回波以及发声者语音信息传播到接收处,即采样率为48khz的手机麦克风,进入声音信号转换为电信号的阶段,在此案例中用户所述内容为“aeiou”五个英文字母。此阶段的流程图请见图2。
首先通过对样本的有效值检测判断是否接收到有效信号,认为有效值高于提取的环境噪音有效值10倍以上即为有效信号。
利用软件自带的函数提取有效样本的样本采样率,若确认其小于100khz,而后进行重采样,其具体操作如下:
首先进行fft变换,并在频谱中将样本在频域对采样率频率进行补零操作使其达到384khz,之后进行ifft变换得到采样率为384khz的样本片段,可以发现经过重采样后数据长度扩展为原来的8倍,重采样结果参考图4(上图为重采样前,下图为重采样后)。
步骤3:对重采样得到的样本进行滤波。在频域通过端点检测判断有效低频信号的最高频率以及有效高频信号的最低频率,采用两个频率的平均值作为滤波频率,本案例中采用10khz;将原来的数据滤波后得到频率小于10khz的样本以及频率大于10khz的样本,其具体操作如下:
对样本进行fft变换,分别将高于10khz的数据以及低于10khz的数据置零,得到两组数据,分别进行ifft变换后得到目标信号。
由于本案例的语音信息采用分立音节,故可不进行端点检测。
步骤4:对高频部分提取包络,得到超声回波的包络信息。具体应用希尔伯特变换,其原理如下:
希尔伯特变换能在振幅保持不变的情况下将输入信号的相角偏移90度,简单地说就是能够将正弦波形转换为余弦波形。相角偏移90度相当于复数平面上的点与虚数单位1j相乘,因此希尔伯特变换的频率响应可以用如下公式表示:
h(ω)=-jsgn(ω)
利用希尔伯特变换做包络检波的原理公式如下:
根据上述包络检波的原理获得滤波后的高频超声回波信号的包络信息。
步骤5:将得到的包络与低频语音信号进行相关性判断,其结果如图5和图6所示。图5为对象为用户时的低频信号和高频包络的相关性结果图(由上到下分别为低频信号,高频信号,高频信号包络线)。图6为对象为攻击者时的低频信号和高频包络的相关性结果图(由上到下分别为低频信号,高频信号,高频信号包络线)。相关性大于深度学习得到的阈值判定为用户,反之则判断为重放攻击者。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以作出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应该以所附权利要求为准。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除