音频差异检测方法、装置、设备及可读存储介质与流程

2021-01-28 18:01:32|

312|

起点商标网

本发明涉及音频处理技术领域，尤其涉及一种音频差异检测方法、装置、设备及可读存储介质。

背景技术：

随着科学技术的发展和硬件计算能力的大幅提升，音频识别技术的发展也日臻完善，并广泛应用到了各个领域。在公安侦查领域，通常需要对疑似音频进行对比。办案人员在对比鉴定的过程中，通常需要反复听辨对比音频的差异部分。然而通过人为对于对比音频的语音图谱进行直观比较，或是直接辨听对比音频的方式都太过繁琐，难以快速确定对比音频间的差异，从而导致了音频差异对比效率低下的技术问题。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

技术实现要素：

本发明的主要目的在于提供一种音频差异检测方法，旨在解决音频差异对比效率低下的技术问题。

为实现上述目的，本发明提供一种音频差异检测方法，所述音频差异检测方法应用于音频差异检测设备，所述音频差异检测方法包括以下步骤：

接收音频对比指令，获取基于所述音频对比指令确定的标准音频、对照音频与基准信息；

获取所述标准音频与对照音频分别对应的第一语音波形图与第二语音波形图，并基于所述基准信息对所述第一语音波形图与第二语音波形图进行重叠对比；

确定并输出所述第一语音波形图与第二语音波形图的差异部分以及对应的差异数据，根据预设阈值确定所述标准音频与对照音频的相似等级。

可选地，所述预设阈值包括预设第一阈值和预设第二阈值，

所述根据预设阈值确定所述标准音频与对照音频的相似等级的步骤包括：

判断所述第一语音波形图与第二语音波形图的重叠率是否超出预设第一阈值；

若未超出预设第一阈值，则确定所述相似等级为低度相似；

若超出预设第一阈值，则判断是否超出预设第二阈值，其中，预设第一阈值小于预设第二阈值；

若未超出预设第二阈值，则确定所述相似等级为中度相似。

可选地，所述判断是否超出预设第二阈值的步骤之后，还包括：

若超出预设第二阈值，则对所述标准音频与对照音频进行快速傅里叶变换，分别生成第一语谱图与第二语谱图；

比较所述第一语谱图与第二语谱图并得到特征差异，判断所述特征差异是否满足预设语谱特征条件；

若不满足，则确定所述相似等级为高度相似；

若满足，则将所述对照音频标记为所述标准音频的翻录音频。

可选地，所述判断所述第一语谱图与第二语谱图之间的特征差异是否满足预设语谱特征条件的步骤包括：

判断所述第一语谱图与第二语谱图之间的共振峰边缘频率的同步率是否达到预设第三阈值；

若达到预设第三阈值，则判定所述特征差异满足预设语谱特征条件；

若未达到预设第三阈值，则判定所述特征差异不满足预设语谱特征条件。

可选地，所述输出所述第一语音波形图与第二语音波形图的差异部分以及对应的差异数据的步骤包括：

截取并显示所述第一语音波形图与第二语音波形图的差异部分对照图；

获取所述第一语音波形图与第二语音波形图之间的幅值差值以及时间差值，将所述幅值差值以及时间差值对应显示在所述差异部分对照图中，其中所述差异数据包括所述幅值差值和所述时间差值。

可选地，所述根据预设阈值确定所述标准音频与对照音频的相似等级的步骤之后，还包括：

将所述标准音频与对照音频中关于所述差异部分对照图对应的目标音频部分进行截取，并将所述目标音频部分与所述差异部分对照图关联。

可选地，所述获取所述标准音频与对照音频分别对应的第一语音波形图与第二语音波形图的步骤之前，还包括：

对所述标准音频与对照音频进行降噪处理。

此外，为实现上述目的，本发明还提供一种音频差异检测装置，所述音频差异检测装置包括：

音频信息获取模型，用于接收音频对比指令，获取基于所述音频对比指令确定的标准音频、对照音频与基准信息；

语音波形对比模块，用于获取所述标准音频与对照音频分别对应的第一语音波形图与第二语音波形图，并基于所述基准信息对所述第一语音波形图与第二语音波形图进行重叠对比；

相似等级确定模块，用于确定并输出所述第一语音波形图与第二语音波形图的差异部分以及对应的差异数据，根据预设阈值确定所述标准音频与对照音频的相似等级。

进一步地，所述相似等级确定模块包括：

第一阈值判断单元，用于判断所述第一语音波形图与第二语音波形图的重叠率是否超出预设第一阈值；

低度相似判定单元，用于若未超出预设第一阈值，则确定所述相似等级为低度相似；

第二阈值判断单元，用于若超出预设第一阈值，则判断是否超出预设第二阈值，其中，预设第一阈值小于预设第二阈值；

中度相似判定单元，用于若未超出预设第二阈值，则确定所述相似等级为中度相似。

进一步地，所述相似等级确定模块包括：

语谱图像生成单元，用于若超出预设第二阈值，则对所述标准音频与对照音频进行快速傅里叶变换，分别生成第一语谱图与第二语谱图；

语谱特征判断单元，用于比较所述第一语谱图与第二语谱图并得到特征差异，判断所述特征差异是否满足预设语谱特征条件；

高度相似判定单元，用于若不满足，则确定所述相似等级为高度相似；

翻录音频判定单元，用于若满足，则将所述对照音频标记为所述标准音频的翻录音频。

进一步地，所述相似等级确定模块包括：

第三阈值判断单元，用于判断所述第一语谱图与第二语谱图之间的共振峰边缘频率的同步率是否达到预设第三阈值；

条件满足判定单元，用于若达到预设第三阈值，则判定所述特征差异满足预设语谱特征条件；

条件不满判定单元，用于若未达到预设第三阈值，则判定所述特征差异不满足预设语谱特征条件。

进一步地，所述相似等级确定模块包括：

差异对照显示单元，用于截取并显示所述第一语音波形图与第二语音波形图的差异部分对照图；

差异数值显示单元，用于获取所述第一语音波形图与第二语音波形图之间的幅值差值以及时间差值，将所述幅值差值以及时间差值对应显示在所述差异部分对照图中，其中所述差异数据包括所述幅值差值和所述时间差值。

进一步地，所述音频差异检测装置还包括：

差异音频关联模块，用于将所述标准音频与对照音频中关于所述差异部分对照图对应的目标音频部分进行截取，并将所述目标音频部分与所述差异部分对照图关联。

进一步地，所述语音波形对比模块还包括：

音频降噪单元，用于对所述标准音频与对照音频进行降噪处理。

此外，为实现上述目的，本发明还提供一种音频差异检测设备，所述音频差异检测设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的音频差异检测程序，所述音频差异检测程序被所述处理器执行时实现如上述的音频差异检测方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有音频差异检测程序，所述音频差异检测程序被处理器执行时实现如上述的音频差异检测方法的步骤。

本发明提供一种音频差异检测方法、装置、设备及计算机可读存储介质。所述音频差异检测方法通过接收音频对比指令，获取基于所述音频对比指令确定的标准音频、对照音频与基准信息；获取所述标准音频与对照音频分别对应的第一语音波形图与第二语音波形图，并基于所述基准信息对所述第一语音波形图与第二语音波形图进行重叠对比；确定并输出所述第一语音波形图与第二语音波形图的差异部分以及对应的差异数据，根据预设阈值确定所述标准音频与对照音频的相似等级。通过上述方式，本发明通过获取用于对比标准音频与对照音频的基准信息，便于有效地将两类音频进行比较；根据基准信息自动将标准音频与对照音频的语音波形图进行重叠比较，使得用户能够一键实现对两类音频的波形图的有效对比，提高了音频比较操作的效率，同时也提升了用户体验；通过进一步确定两类音频的相似等级，并单独输出差异部分以及具体的差异数据，使得用户能够快速获取到两类音频差异的详细信息，进一步提高了对于音频差异信息获取的效率，从而解决了音频差异对比效率低下的技术问题。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图；

图2为本发明音频差异检测方法第一实施例的流程示意图；

图3为本发明音频差异检测方法第二实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。

本发明实施例终端可以是pc，也可以是智能手机、平板电脑、mp3(movingpictureexpertsgroupaudiolayeriii，动态影像专家压缩标准音频层面3)播放器、mp4(movingpictureexpertsgroupaudiolayeriv，动态影像专家压缩标准音频层面3)播放器等具有显示功能的可移动式终端设备。

如图1所示，该终端可以包括：处理器1001，例如cpu，通信总线1002，用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard)，可选的用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器，也可以是稳定的存储器(non-volatilememory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。

可选地，终端还可以包括摄像头、rf(radiofrequency，射频)电路，音频电路、wifi模块等等。

本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及音频差异检测程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的音频差异检测程序，并执行以下操作：

接收音频对比指令，获取基于所述音频对比指令确定的标准音频、对照音频与基准信息；

确定并输出所述第一语音波形图与第二语音波形图的差异部分以及对应的差异数据，根据预设阈值确定所述标准音频与对照音频的相似等级。