气流杂音消除方法、装置、计算机设备及存储介质与流程
【技术领域】
本发明涉及计算机技术领域,尤其涉及一种气流杂音消除方法、装置、计算机设备及存储介质。
背景技术:
扬声器气流杂音是扬声器杂音的主要来源之一。微型扬声器腔体较小,结构精密,但是振膜振幅较大,气流在腔体内容易形成湍流并产生流致噪声。流致噪声经过小腔体共振放大,在频率较高的高频谐振峰附近形成宽频的能量集中分布,形成人们主观听音中的气流杂音,主要表现为“嘶嘶”“沙沙”声。气流杂音是微型扬声器中普遍存在的问题,在大电压、大振幅的情况下愈加明显。不同样品存在差异,与扬声器的腔体结构、发声方式有显著关系。
然而,现有的技术往往是通过改变腔体结构、出声孔和导管设计等改变扬声器物理结构方式来改善微型扬声器气流杂音的问题,但这种方法工艺成本较高、周期较长,且通用性受到限制,改善效果不佳。鉴于此,亟需提供一种新的气流杂音消除方法。
技术实现要素:
有鉴于此,本发明提供了一种气流杂音消除方法、装置、计算机设备及存储介质,用于解决现有技术中气流杂音消除效果不佳的问题。
本发明实施例的具体技术方案为:
第一方面,本发明实施例提供一种气流杂音消除方法,应用于微型扬声器,包括:
采集微型扬声器中的原始音频信号,对所述原始音频信号进行预处理,得到初始信号;
对所述初始信号进行特征提取,得到音频特征;
根据所述音频特征对所述初始信号进行分类,确定所述初始信号的类别;
当所述初始信号的类别为包含激励气流杂音的信号,则对所述初始信号进行信号压缩处理,得到目标压缩信号。
进一步地,在所述对所述初始信号进行信号压缩处理,得到目标压缩信号之后,还包括:
将所述目标压缩信号,通过淡入淡出机制进行编辑,得到目标音频信号。
进一步地,对所述初始信号进行特征提取,得到音频特征,包括:
提取所述初始信号高频分量包络和低频分量包络,并根据所述高频分量包络和所述低频分量包络的比值确定所述音频特征,和/或提取所述初始信号的梅尔倒谱系数作为所述音频特征。
进一步地,根据所述音频特征对所述初始信号进行分类,确定所述初始信号的类别,包括:
若根据所述高频分量包络和所述低频分量包络的比值确定所述音频特征,则获取所述高频分量包络和所述低频分量包络的比值;
当所述比值小于预设比值阈值时,则确定所述初始信号的类别为包含激励气流杂音的信号;
当所述比值大于或者等于预设比值阈值时,则确定所述初始信号的类别为不包含激励气流杂音的信号。
进一步地,根据所述音频特征对所述初始信号进行分类,确定所述初始信号的类别,包括:
若所述音频特征为所述初始信号的梅尔倒谱系数,则将所述梅尔倒谱系数输入到音频信号分类器进行分类,得到所述初始信号的类别。
进一步地,对所述初始信号进行信号压缩处理,得到目标压缩信号,得到目标压缩信号,包括:
计算所述初始信号的振膜速度;
根据所述振膜速度和预设速度阈值,对所述初始信号进行信号压缩处理,得到所述目标压缩信号。
进一步地,所述方法还包括:
获取训练样本集,所述训练样本集中包括初始信号的梅尔倒谱系数和对应的音频类别;
将所述梅尔倒谱系数作为预设的分类器的输入,将所述音频类别作为期望的输出,对预设的分类器进行训练,得到训练完成的所述音频信号分类器。
第二方面,本发明实施例还提供一种气流杂音消除装置,包括:
信号获取模块,用于采集微型扬声器中的原始音频信号,对所述原始音频信号进行预处理,得到初始信号;
特征提取模块,用于对所述初始信号进行特征提取,得到音频特征;
信号分类模块,用于根据所述音频特征对所述初始信号进行分类,确定所述初始信号的类别;
信号压缩模块,用于当所述初始信号的类别为包含激励气流杂音的信号,则对所述初始信号进行信号压缩处理,得到目标压缩信号。
第三方面,本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述气流杂音消除方法的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,包括计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如上所述气流杂音消除方法的步骤。
实施本发明实施例,将具有如下有益效果:
采用了上述气流杂音消除方法、装置、计算机设备及存储介质之后,通过采集微型扬声器中的原始音频信号,对原始音频信号进行预处理,得到初始信号;对初始信号进行特征提取,得到音频特征;根据音频特征对初始信号进行分类,确定初始信号的类别;当初始信号的类别为包含激励气流杂音的信号,则对初始信号进行信号压缩处理,得到目标压缩信号,通过对音频特征进行分析和量化,确定气流杂音的音频信号,由于只对有气流杂音信号进行滤除,最大程度地保留了原始音频信号,并且在不改变微型扬声器结构的基础上,通过对音频特特征进行一系列处理,提高了微型扬声器的声音输出质量,提升用户体验。
【附图说明】
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中所述气流杂音消除方法的流程图;
图2为一个实施例中所述目标音频信号的波形图的示意图;
图3为一个实施例中所述初始信号的类别确定方法的流程图;
图4为一个实施例中所述目标压缩信号确定方法的流程图;
图5为另一个实施例中所述气流杂音消除方法的流程图;
图6为一个实施例中所述气流杂音消除方法装置的结构示意图;
图7为一个实施例中运行上述气流杂音消除方法的计算机设备的内部结构示意图。
【具体实施方式】
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为解决传统技术中通过改变腔体结构、出声孔和导管设计等改变扬声器物理结构方式来改善微型扬声器气流杂音的改善效果不佳问题。
基于上述问题,在本实施例中,特提出了一种气流杂音消除方法。该方法的实现可依赖于计算机程序,该计算机程序可运行于基于冯诺依曼体系的计算机系统之上。
如图1所示,本实施例提供的气流杂音消除方法,应用于微型扬声器,该气流杂音消除方法具体包括以下步骤:
步骤102:采集微型扬声器中的原始音频信号,对原始音频信号进行预处理,得到初始信号。
其中,原始音频信号是指微信扬声器中的未经处理的信号,初始信号是指对原始音频信号进行预处理后的音频信号。通常,原始音频信号由于微型扬声器腔体较小,结构精密,但是振膜振幅较大,使得气流在腔体内容易形成湍流并产生流致噪声,因此,本实施例中还对原始音频信号进行预处理,以调整原始音频信号的动态范围和信号频域能量分布,补偿微型扬声器频率响应等。其中的预处理包括但不限于是drc(dynamicrangecontrol,动态范围压缩处理)、mbdrc(multi-banddynamicrangecontrol,多频段动态范围压缩处理),eq(equaliser,均衡处理)中的至少一种。可以理解地,通过对原始音频信号进行预处理,使得初始信号适合微型扬声器播放,以便后续提取更加清晰可靠的音频特征。
步骤104:对初始信号进行特征提取,得到音频特征。
其中,音频特征是用于表征音频信号的特征,具体地,可以通过c/c++、python、matlab等工具包对初始信号进行特征提取,得到音频特征,如梅尔倒谱系数(mfcc)、线性预测普系数(lpcc)或者分量包络等。作为本实施例的优选,为了更好地分辨气流杂音,提取初始信号的梅尔倒谱系数(mfcc)或者分量包络作为音频特征,以利用该音频特征的可视化和量化的特点进行更为准确地分析。
步骤106:根据音频特征对初始信号进行分类,确定初始信号的类别。
具体地,初始信号的类别包括两类,分别为包含激励气流杂音的信号的类别、不包含激励气流杂音的信号的类别。具体地,通过对音频特征进行分析,例如,可以将音频特征与预设的分类阈值进行比较,根据比较结果,确定初始信号的类别;还可以预先训练初始信号的类别分类器,然后将音频特征输入到类别分类器,输出的类别即为初始信号的类别。可以理解地,本实施例通过对音频特征进行分析,基于音频特征的量化值进行比较,确定初始信号的类别,以便识别出初始信号中包含的气流杂音。
步骤108:当初始信号的类别为包含激励气流杂音的信号,则对初始信号进行信号压缩处理,得到目标压缩信号。
其中,目标压缩信号是指已经消除了气流杂音的初始信号。信号压缩处理是一种用于降低音频信号振动速度的处理过程。具体地,可以通过声学模型(speakermodel),如隐马尔科夫模型(hmm)预测初始信号在微型扬声器上产生气流杂音的强度,根据气流杂音的强度将初始信号的气流杂音降低到预设阈值以内,其中,不同的微型扬声器的预设阈值可能不同,可以通过主观听音来确定。可以通过压drc实现对初始信号的气流杂音的轻度进行压缩,得到目标压缩信息,实现了对其气流杂音的消除。可以理解地,通过对音频特征进行分析和量化,确定气流杂音的音频信号,由于只对有气流杂音信号进行滤除,最大程度地保留了原始音频信号,并且在不改变微型扬声器结构的基础上,通过对音频特特征进行一系列处理,提高了微型扬声器的声音输出质量,提升用户体验。
上述气流杂音消除方法,通过采集微型扬声器中的原始音频信号,对原始音频信号进行预处理,得到初始信号;对初始信号进行特征提取,得到音频特征;根据音频特征对初始信号进行分类,确定初始信号的类别;当初始信号的类别为包含激励气流杂音的信号,则对初始信号进行信号压缩处理,得到目标压缩信号,通过对音频特征进行分析和量化,确定气流杂音的音频信号,由于只对有气流杂音信号进行滤除,最大程度地保留了原始音频信号,并且在不改变微型扬声器结构的基础上,通过对音频特特征进行一系列处理,提高了微型扬声器的声音输出质量,提升用户体验。
在一个实施例中,在对初始信号进行信号压缩处理,得到目标压缩信号之后,还包括:
将目标压缩信号,通过淡入淡出机制进行编辑,得到目标音频信号。
其中,淡入淡出机制是一种用于提高音频信号连续性的处理方式,淡入淡出机制包括淡入和淡出,淡入在初始信号的类别从不包含激励气流杂音的信号变为包含激励气流杂音的信号的瞬间起作用,淡出在初始信号的类别从包含激励气流杂音的信号变为不包含激励气流杂音的信号的瞬间起作用。目标音频信号是指通过微型扬声器进行播放的音频信号。可以理解地,由于步骤106对初始信号进行了分类,然后对类别为包含激励气流杂音的信号进行了信号压缩处理,由此可能会导致类别为包含激励气流杂音的信号与类别为不包含激励气流杂音的信号发生突变,影响微型扬声器的声音输出质量,因此,将目标压缩信号通过淡入淡出机制进行编辑,提高音频信号的连续性,进而提高音频信号质量。如图2所示,为目标音频信号的波形图,其中,w(t)为对类别为包含激励气流杂音的信号进行信号压缩处理的波形,f(t)表示为初始信号类别的波形,从图2中可以看出,在初始信号类别发生变化的时间段内,通过加入淡出淡出机制,实现了目标音频信号的连续性,进而进一步提高了目标音频信号质量。
在一个实施例中,对初始信号进行特征提取,得到音频特征,包括:
提取初始信号高频分量包络和低频分量包络,并根据高频分量包络和低频分量包络的比值确定音频特征,和/或提取初始信号的梅尔倒谱系数作为音频特征。
具体地,本实施例中的音频特征为初始信号的高频分量包络和低频分量包络的比值值,和/或初始信号的梅尔倒谱系数。其中的高频分量包络、低频分量包络可以通过平方律检波技术(sql)分别进行提取,然后计算高频分量包络、低频分量包络的比例值,得到音频特征。其中的梅尔倒谱系数可以通过matlab工具自带的evenlope函数或者hilbert函数进行提取。可以理解地,本实施例中的高频分量包络和低频分量包络的比值值,和/或初始信号的梅尔倒谱系数能够很好地反映音频信号的气流杂音信息,因此,提高了音频特征的可靠性。
如图3所示,在一个实施例中,根据音频特征对初始信号进行分类,确定初始信号的类别,包括:
步骤106a:若根据高频分量包络和低频分量包络的比值确定音频特征,则获取高频分量包络和低频分量包络的比值;
步骤106b:当比值小于预设比值阈值时,则确定初始信号的类别为包含激励气流杂音的信号;
步骤106c:当比值大于或者等于预设比值阈值时,则确定初始信号的类别为不包含激励气流杂音的信号。
在这个实施例中,当音频特征为高频分量包络和低频分量包络的比值时,通过将该比值与预设比值阈值进行比较,根据比较结果确定初始信号的类别。其中的预设比值阈值是用于区分初始信号的类别的比值的临界值。示例性地,该预设比例阈值为10-5,当比值小于预设比值阈值时,初始信号的类别为包含激励气流杂音的信号,当比值大于或者等于预设比值阈值时,初始信号的类别为不包含激励气流杂音的信号。可以理解地,通过比较高频分量包络和低频分量包络的比值与预设比值阈值,能够快速准确地确定初始信号的类别。
在一个实施例中,根据音频特征对初始信号进行分类,确定初始信号的类别,包括:
若音频特征为初始信号的梅尔倒谱系数,则将梅尔倒谱系数输入到音频信号分类器进行分类,得到初始信号的类别。
在这个实施例中,对于音频特征为初始信号的梅尔倒谱系数的情况,利用机器学习模型的方法确定初始信号的类别,即利用预先训练好的音频信号分类器进行分类,得到初始信号的类别。其中的机器学习模型可以是支持向量机模型svm,也可以是使用集成学习ensemble方法组合多个弱分类器而成的分类器集,可以理解地,通过音频信号分类器对初始信号进行分类,利用了机器学习的较高准确度的特点,提高了初始信号类别确定的准确性。
如图4所示,在一个实施例中,对初始信号进行信号压缩处理,得到目标压缩信号,得到目标压缩信号,包括:
步骤110:计算初始信号的振膜速度;
步骤112:根据振膜速度和预设速度阈值,对初始信号进行信号压缩处理,得到目标压缩信号。
具体地,振膜速度是一种用于反映音频信号的气流杂音强度的指标数据,具体地,比较振膜速度和预设速度阈值,当振膜速度大于预设速度阈值时,通过声学模型计算初始信号的振膜速度,然后采用drc或者mbdrc对初始信号进行信号压缩处理,并压缩至预设速度阈值以内,从而达到了对气流杂音滤除的功能,实现了气流杂音的消除,进而提高了微型扬声器输出的声音质量,提升用户体验。
如图5所示,在一个实施例中,该气流杂音消除方法还包括:
步骤114:获取训练样本集,训练样本集中包括初始信号的梅尔倒谱系数和对应的音频类别;
步骤116:将梅尔倒谱系数作为预设的分类器的输入,将音频类别作为期望的输出,对预设的分类器进行训练,得到训练完成的音频信号分类器。
具体地,获取已确定为类别为包含激励气流杂音的信号的样本,并获取已确定为类别为不包含激励气流杂音的信号的样本,将初始信号的梅尔倒谱系数作为预设的分类器的输入,将音频类别作为期望的输出,对预设的分类器进行训练,可生成与训练样本集中的梅尔倒谱系数相应的音频类别,从而根据与梅尔倒谱系数对应的期望的输出,训练预设的分类器,得到训练完成的环境分类器。
本实施例中,训练样本集包括类别为包含激励气流杂音的信号的梅尔倒谱系数以及类别为不包含激励气流杂音的信号的梅尔倒谱系数,保证了训练样本集的全面性,利用这样训练样本集训练出的音频信号分类器能够学习到更加全面准确的音频类别分类规则,提高了训练机器学习预设分类器的效率,从而可以进一步提高对初始信号的类别区分的效率。
基于同一发明构思,本发明实施例提供一种气流杂音消除装置600,如图6所示,包括:信号获取模块602,用于采集微型扬声器中的原始音频信号,对所述原始音频信号进行预处理,得到初始信号;特征提取模块604,用于对所述初始信号进行特征提取,得到音频特征;信号分类模块606,用于根据所述音频特征对所述初始信号进行分类,确定所述初始信号的类别;信号压缩模块608,用于当所述初始信号的类别为包含激励气流杂音的信号,则对所述初始信号进行信号压缩处理,得到目标压缩信号。
具体地,本实施例的气流杂音消除装置600,如图6所示,包括:信号获取模块602,用于采集微型扬声器中的原始音频信号,对所述原始音频信号进行预处理,得到初始信号;特征提取模块604,用于对所述初始信号进行特征提取,得到音频特征;信号分类模块606,用于根据所述音频特征对所述初始信号进行分类,确定所述初始信号的类别;信号压缩模块608,用于当所述初始信号的类别为包含激励气流杂音的信号,则对所述初始信号进行信号压缩处理,得到目标压缩信号。通过对音频特征进行分析和量化,确定气流杂音的音频信号,由于只对有气流杂音信号进行滤除,最大程度地保留了原始音频信号,并且在不改变微型扬声器结构的基础上,通过对音频特特征进行一系列处理,提高了微型扬声器的声音输出质量,提升用户体验。
需要说明的是,本实施例中气流杂音消除装置的实现与上述气流杂音消除方法的实现思想一致,其实现原理在此不再进行赘述,可具体参阅上述方法中对应内容。
图7示出了一个实施例中计算机设备的内部结构图。该计算机设备700具体可以是服务器,也可以是终端。如图7所示,该计算机设备包括通过系统总线连接的处理器710、存储器720和网络接口730。其中,存储器720包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现气流杂音消除方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行气流杂音消除方法。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图7中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的气流杂音消除方法可以实现为一种计算机程序的形式,计算机程序可在如图7所示的计算机设备上运行。计算机设备的存储器中可存储组成所述气流杂音消除装置的各个程序模块。比如,信号获取模块602,特征提取模块604,信号分类模块606,信号压缩模块608。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:采集微型扬声器中的原始音频信号,对所述原始音频信号进行预处理,得到初始信号;对所述初始信号进行特征提取,得到音频特征;根据所述音频特征对所述初始信号进行分类,确定所述初始信号的类别;当所述初始信号的类别为包含激励气流杂音的信号,则对所述初始信号进行信号压缩处理,得到目标压缩信号。
在一个实施例中,提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如下步骤:采集微型扬声器中的原始音频信号,对所述原始音频信号进行预处理,得到初始信号;对所述初始信号进行特征提取,得到音频特征;根据所述音频特征对所述初始信号进行分类,确定所述初始信号的类别;当所述初始信号的类别为包含激励气流杂音的信号,则对所述初始信号进行信号压缩处理,得到目标压缩信号。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除