HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

一种去混响方法及装置与流程

2021-01-28 14:01:25|331|起点商标网
一种去混响方法及装置与流程

本申请涉及语音信号处理领域,具体而言,涉及一种去混响方法及装置。



背景技术:

在远程或者非手持模式下的语音通信以及人机交互系统中,由于声源信号在传播过程中会经过墙壁、地板或天花板等的反射,因此,麦克风传感器除了可以接收到直达波和一些对于听觉有益的早期反射之外,将不可避免地接收到由晚期反射所构成的混响成分。其中,这些混响成分的存在会使语音的质量以及可懂度降低,严重影响语音识别、声源定位等信号处理算法的性能。

现有技术中,去混响的方法主要包括四种类型:基于信道均衡的方法、基于谱抑制的方法、基于空域滤波的方法以及基于线性预测的方法。其中,基于线性预测的方法是设计一个预测滤波器来估计出混响成分,然后从观测信号去除掉这一部分得到期望信号的估计。其中,加权预测误差方法(weighted-prediction-error,wpe)是基于线性预测的方法的一种。

wpe算法通过引入了预测时延并用随时间变化的期望信号的方差来对预测误差进行加权,从而提升了算法的性能,但是,wpe算法存在计算复杂度较高的问题。



技术实现要素:

本申请实施例的目的在于提供一种去混响方法及装置,用以解决计算复杂度较高的技术问题。

为了实现上述目的,本申请实施例所提供的技术方案如下所示:

第一方面,本申请实施例提供一种去混响方法,包括:获取麦克风阵列采集的混响信号;其中,所述混响信号为声源信号经过多次反射产生的信号;;根据所述声源信号、所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法,确定所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,以使代价函数的值最小;其中,所述去混响算法包括第一子滤波器参数以及第二子滤波器参数,所述第一子滤波器参数以及所述第二子滤波器参数之间运用克罗内克积运算;根据所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,确定所述混响信号对应的期望信号的估计值为去混响后的声音信号。在上述方案中,将现有技术中的多通道线性预测滤波器,分解为时域和空域两个子滤波器参数的克罗内克积。由于经过基于克罗内克积的分解,因此去混响算法中所需要求逆的协方差矩阵的尺寸大大减小,从而使得去混响算法所需要的计算量随之减小,进而较低了计算的复杂度。

在本申请的可选实施例中,所述根据所述声源信号、所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法,确定所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,以使代价函数的值最小,包括:根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值;根据所述期望信号的估计值确定所述声源信号的方差;根据所述期望信号的估计值以及所述方差确定所述声源信号的两个子协方差矩阵以及一个子协方差向量;根据所述子协方差矩阵以及所述子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值;以所述新的第一子滤波器的值为所述第一子滤波器参数的初始值以及以所述新的第二子滤波器的值为所述第二子滤波器参数的初始值,执行所述根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值的步骤,直至所述去混响算法满足预设条件,并得到所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值。

在本申请的可选实施例中,所述根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值,包括:利用如下公式计算所述期望信号的估计值:

其中,为所述期望信号的估计值,g1为所述第一子滤波器参数,长为l,g2为所述第二子滤波器参数,长为m,y(n)为第n帧的观测信号向量,为长为ml的观测信号向量,d为预测时延,l为所述第一子滤波器参数的阶数,m为所述麦克风的数量。

在本申请的可选实施例中,所述根据所述期望信号的估计值以及所述方差确定所述声源信号的两个子协方差矩阵,包括:利用如下公式计算所述声源信号的两个子协方差矩阵:

其中,为大小为l×l的子协方差矩阵,为大小为m×m的子协方差矩阵,是长为l的向量,为尺寸为ml×l的矩阵,是长为m的向量,为尺寸为ml×m的矩阵,g1为所述第一子滤波器参数,长为l,g2为所述第二子滤波器参数,长为m,il为尺寸为l×l的单位矩阵,im为尺寸为m×m的单位矩阵,y(n)为第n帧的观测信号向量,为长为ml的观测信号向量,d为预测时延,l为所述第一子滤波器参数的阶数,m为所述麦克风的数量,为所述方差,为所述期望信号的估计值。

在本申请的可选实施例中,所述根据所述期望信号的估计值以及所述方差确定所述声源信号的一个子协方差向量,包括:利用如下公式计算所述声源信号的一个子协方差向量:

其中,为长为l的所述子协方差向量,是长为l的向量,为尺寸为ml×l的矩阵,为长为ml的观测信号向量,il为尺寸为l×l的单位矩阵,l为所述第一子滤波器参数的阶数,m为所述麦克风的数量,d为预测时延,为所述方差,为所述期望信号的估计值。

在本申请的可选实施例中,所述根据所述子协方差矩阵以及所述子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值,包括:利用如下公式计算所述新的第一子滤波器的值以及所述新的第二子滤波器的值:

其中,g1(1)为所述新的第一子滤波器的值,g2(1)为所述新的第二子滤波器的值,为大小为m×m的子协方差矩阵,为大小为l×l的子协方差矩阵,为长为l的所述子协方差向量,是长为l的向量,为尺寸为ml×l的矩阵,是长为m的向量,为尺寸为ml×m的矩阵,g1为所述第一子滤波器参数,长为l,g2为所述第二子滤波器参数,长为m,il为尺寸为l×l的单位矩阵,im为尺寸为m×m的单位矩阵,y(n)为第n帧的观测信号向量,为长为ml的观测信号向量,d为预测时延,l为所述第一子滤波器参数的阶数,m为所述麦克风的数量,d为短时傅里叶变换域中能够对应于期望方向的导向适量或者相对早期传递函数。

在本申请的可选实施例中,在所述获取麦克风阵列采集的混响信号之后,所述方法还包括:对所述声源信号进行傅里叶变换;根据所述傅里叶变换后的信号构建期望信号模型,并根据所述期望信号模型估计出对应的期望信号;基于所述克罗内克积运算对所述期望信号模型进行变换,得到所述去混响算法;根据所述去混响算法确定去混响输出信号;根据所述去混响输出信号确定所述代价函数。

第二方面,本申请实施例提供一种去混响装置,包括:获取模块,用于获取麦克风阵列采集的混响信号;其中,所述混响信号为声源信号经过多次反射产生的信号;第一确定模块,用于根据所述声源信号、所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法,确定所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,以使代价函数的值最小;其中,所述去混响算法包括第一子滤波器参数以及第二子滤波器参数,所述第一子滤波器参数以及所述第二子滤波器参数之间运用克罗内克积运算;第二确定模块,用于根据所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,确定所述混响信号对应的期望信号的估计值为去混响后的声音信号。在上述方案中,将现有技术中的多通道线性预测滤波器,分解为时域和空域两个子滤波器参数的克罗内克积。由于经过基于克罗内克积的分解,因此去混响算法中所需要求逆的协方差矩阵的尺寸大大减小,从而使得去混响算法所需要的计算量随之减小,进而较低了计算的复杂度。

在本申请的可选实施例中,所述第一确定模块还用于:根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值;根据所述期望信号的估计值确定所述声源信号的方差;根据所述期望信号的估计值以及所述方差确定所述声源信号的两个子协方差矩阵以及一个子协方差向量;根据所述子协方差矩阵以及所述子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值;以所述新的第一子滤波器的值为所述第一子滤波器参数的初始值以及以所述新的第二子滤波器的值为所述第二子滤波器参数的初始值,执行所述根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值的步骤,直至所述去混响算法满足预设条件,并得到所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值。

在本申请的可选实施例中,所述第一确定模块还用于:利用如下公式计算所述期望信号的估计值:

其中,为所述期望信号的估计值,g1为所述第一子滤波器参数,长为l,g2为所述第二子滤波器参数,长为m,y(n)为第n帧的观测信号向量,为长为ml的观测信号向量,d为预测时延,l为所述第一子滤波器参数的阶数,m为所述麦克风的数量。

在本申请的可选实施例中,所述第一确定模块还用于:利用如下公式计算所述声源信号的两个子协方差矩阵:

其中,为大小为l×l的子协方差矩阵,为大小为m×m的子协方差矩阵,是长为l的向量,为尺寸为ml×l的矩阵,是长为m的向量,为尺寸为ml×m的矩阵,g1为所述第一子滤波器参数,长为l,g2为所述第二子滤波器参数,长为m,il为尺寸为l×l的单位矩阵,im为尺寸为m×m的单位矩阵,y(n)为第n帧的观测信号向量,为长为ml的观测信号向量,d为预测时延,l为所述第一子滤波器参数的阶数,m为所述麦克风的数量,为所述方差,为所述期望信号的估计值。

在本申请的可选实施例中,所述第一确定模块还用于:利用如下公式计算所述声源信号的一个子协方差向量:

其中,为长为l的所述子协方差向量,是长为l的向量,为尺寸为ml×l的矩阵,为长为ml的观测信号向量,il为尺寸为l×l的单位矩阵,l为所述第一子滤波器参数的阶数,m为所述麦克风的数量,d为预测时延,为所述方差,为所述期望信号的估计值。

在本申请的可选实施例中,所述第一确定模块还用于:利用如下公式计算所述新的第一子滤波器的值以及所述新的第二子滤波器的值:

其中,g1(1)为所述新的第一子滤波器的值,g2(1)为所述新的第二子滤波器的值,为大小为m×m的子协方差矩阵,为大小为l×l的子协方差矩阵,为长为l的所述子协方差向量,是长为l的向量,为尺寸为ml×l的矩阵,是长为m的向量,为尺寸为ml×m的矩阵,g1为所述第一子滤波器参数,长为l,g2为所述第二子滤波器参数,长为m,il为尺寸为l×l的单位矩阵,im为尺寸为m×m的单位矩阵,y(n)为第n帧的观测信号向量,为长为ml的观测信号向量,d为预测时延,l为所述第一子滤波器参数的阶数,m为所述麦克风的数量,d为短时傅里叶变换域中能够对应于期望方向的导向适量或者相对早期传递函数。

在本申请的可选实施例中,所述装置还包括:第一变换模块,用于对所述声源信号进行傅里叶变换;估计模块,用于根据所述傅里叶变换后的信号构建期望信号模型,并根据所述期望信号模型估计出对应的期望信号;第二变换模块,用于基于所述克罗内克积运算对所述期望信号模型进行变换,得到所述去混响算法;第三确定模块,用于根据所述去混响算法确定去混响输出信号;第四确定模块,用于根据所述去混响输出信号确定所述代价函数。

第三方面,本申请实施例提供一种电子设备,包括:处理器、存储器和总线;所述处理器和所述存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如第一方面中的去混响方法。

第四方面,本申请实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如第一方面中的去混响方法。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举本申请实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的一种去混响方法的流程图;

图2为本申请实施例提供的另一种去混响方法的流程图;

图3为本申请实施例提供的步骤s202的具体实施方式;

图4为本申请实施例提供的一种去混响装置的结构框图;

图5为本申请实施例提供的一种电子设备的结构框图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。

请参照图1,图1为本申请实施例提供的一种去混响方法的流程图,该去混响方法可以包括如下步骤:

步骤s101:对声源信号进行傅里叶变换。

步骤s102:根据傅里叶变换后的信号构建期望信号模型,并根据期望信号模型估计出对应的期望信号。

步骤s103:基于克罗内克积运算对期望信号模型进行变换,得到去混响算法。

步骤s104:根据去混响算法确定去混响输出信号。

步骤s105:根据去混响输出信号确定代价函数。

具体的,在一个室内环境内(例如:录音室、教室等)内的声信号采集过程中,一个由m个麦克风组成的阵列接收到的信号不仅包含了由声源信号卷积上房间冲激响应所产生的混响信号,还包含了一部分的背景噪声。在离散时间k,第m个麦克风所接收到的信号ym(k)可表示为:

ym(k)=hm(k)*s(k)+vm(k),m=1,2,...,m;(1)

其中,hm(k)为声源信号到第m个麦克风的房间冲激响应,s(k)为声源信号,*表示线性卷积,vm(k)为第m个麦克风所接收到的加性噪声。

为了提高算法效率,可以在频域进行处理(步骤s101),因此,在短时傅里叶变换域,公式(1)可以重新表示为ym(n,w):

其中,n是时帧指数,w表示角频率,hm(l,w)是hm(k)的傅里叶变换,阶数为l,而ym(n,w)、s(n,w)和vm(n,w)分别是ym(k)、s(k)和vm(k)的傅里叶变换。需要说明的是,为了表示简洁,后续实施例中将省略w。

在现有技术中,基于多通道线性预测的去混响技术通过从当前帧之前的l帧观测信号中估计出混响,然后将其从观测信号中减去从而得到直达波和早期反射的估计(即期望信号的估计值)。这个过程可以通过下面去混响算法表示(步骤s102):

其中,g为预测滤波器,长为ml,ym(n)为参考信号,

为长为ml的观测信号向量,而在第n-d-l的长为m的观测信号向量可以表示为

y(n-d-l)=[y1(n-d-l)…ym(n-d-l)]t,l=0,1,2,...l-1;(5)

其中,d为预测时延,用来避免过白化的问题。

在wpe算法中,纯净语音信号的时频域系数假定服从一个均值为0,方差为λ(n)的高斯分布,从而根据最大似然估计法可以构造代价函数j(g)为:

其中,n是总时帧数,为所估计的期望信号的方差。

通过最小化代价函数,就可以得到多通道线性预测滤波器g的解:

其中,

是经过加权的观测信号的协方差矩阵和向量,大小分别为ml×ml和ml×1。

然而,采用上述wpe算法存在计算复杂度较高的问题。因此,本申请实施例提供一种去混响算法,将现有技术中的多通道线性预测滤波器,分解为时域和空域两个子滤波器参数的克罗内克积(kronocker)。由于经过基于克罗内克积的分解,因此去混响算法中所需要求逆的协方差矩阵的尺寸大大减小,从而使得去混响算法所需要的计算量随之减小,进而较低了计算的复杂度。

其中,本申请实施例提供的去混响算法为(步骤s103):

其中,表示克罗内克积,g1为第一子滤波器参数,长为l,l为第一子滤波器参数的阶数,g2为第二子滤波器参数,长为m。

在上述公式(10)中,由于第一子滤波器参数以及第二滤波器参数的长度明显小于ml,因此有助于减小算法复杂度。同时,分解后的第二子滤波器可以采用波束形成器,对当前帧的观测信号向量进行滤波,去除掉一部分的混响和噪声,以此波束形成的输出来替换原本的参考信号ym(n),这样可以在不影响观测信号帧间相关性的同时去掉噪声和混响,使得上述去混响算法具有较好的抗噪性能。

接着,可以利用如下的克罗内克积运算具有的性质:

其中,il为尺寸为l×l的单位矩阵,im为尺寸为m×m的单位矩阵,为尺寸为ml×l的矩阵,为尺寸为ml×m的矩阵。

得到去混响输出信号(步骤s104):

以及,

其中,

基于上述公式(10),代价函数可以表示为(步骤s105):

上述公式(18)还可以表示为:

其中,

是长为l的子协方差向量,

为大小为l×l的子协方差矩阵,

为大小为m×m的子协方差矩阵。

进一步的,请参照图2,图2为本申请实施例提供的另一种去混响方法的流程图,该去混响方法基于上述去混响算法,对麦克风采集到的声源信号进行去混响处理。该去混响方法可以包括如下步骤:

步骤s201:获取麦克风阵列采集的混响信号。

步骤s202:根据声源信号、第一子滤波器参数的初始值、第二子滤波器参数的初始值以及去混响算法,确定第一子滤波器参数的确定值以及第二子滤波器参数的确定值,以使代价函数的值最小。

步骤s203:根据第一子滤波器参数的确定值以及第二子滤波器参数的确定值,确定混响信号对应的期望信号的估计值为去混响后的声音信号。

具体的,请参照图3,图3为本申请实施例提供的步骤s202的具体实施方式,上述步骤s202可以包括如下步骤:

步骤s301:根据第一子滤波器参数的初始值、第二子滤波器参数的初始值以及去混响算法计算声源信号对应的期望信号的估计值。

步骤s302:根据期望信号的估计值确定声源信号的方差。

步骤s303:根据期望信号的估计值以及方差确定声源信号的两个子协方差矩阵以及一个子协方差向量。

步骤s304:根据子协方差矩阵以及子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值。

步骤s305:以新的第一子滤波器的值为第一子滤波器参数的初始值以及以新的第二子滤波器的值为第二子滤波器参数的初始值,执行步骤s301,直至去混响算法满足预设条件,并得到第一子滤波器参数的确定值以及第二子滤波器参数的确定值。

其中,可以给定第一子滤波器参数的初始值g1(0)=0以及第二子滤波器参数的初始值然后利用公式(10)计算期望信号的估计值:

以及声源信号的方差

随后,可以利用公式(22)及公式(23)计算声源信号的两个子协方差矩阵:

以及利用公式(21)计算所述声源信号的一个子协方差向量:

其中,再给定第一子滤波器参数g1(0)的初始值之后,可以在保证期望方向无失真响应的前提下,最小化代价函数,即

minj(g2|g1(0))s.t.g2hd=1;(24)

其中,d为短时傅里叶变换域中能够对应于期望方向的导向适量或者相对早期传递函数。

因此,可以将上述优化问题的解表示为:

相似的,再给定第二子滤波器参数g2(0)的初始值之后,可以在保证期望方向无失真响应的前提下,最小化代价函数,即

minj(g1|g2(0));(26)

因此,同样的可以将上述优化问题的解表示为:

显然,请参照图3,可以看出,上述求解第一子滤波器参数以及第二子滤波器参数的过程是一个迭代循环的过程:

根据第一子滤波器参数的初始值、第二子滤波器参数的初始值以及去混响算法计算声源信号对应的期望信号的估计值;根据期望信号的估计值确定声源信号的方差;根据方差确定声源信号的两个子协方差矩阵以及一个子协方差向量;根据子协方差矩阵以及子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值;以新的第一子滤波器的值为第一子滤波器参数的初始值以及以新的第二子滤波器的值为第二子滤波器参数的初始值,根据第一子滤波器参数的初始值、第二子滤波器参数的初始值以及去混响算法计算声源信号对应的期望信号的估计值;根据期望信号的估计值确定声源信号的方差;根据方差确定声源信号的两个子协方差矩阵以及一个子协方差向量;根据子协方差矩阵以及子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值……直至去混响算法满足预设条件,并得到第一子滤波器参数的确定值g1=g1(p)以及第二子滤波器参数的确定值g2=g2(p)

其中,去混响算法满足预设条件可以有多种情况,例如:去混响算法收敛、迭代次数达到预设次数(如:三次等)等,本申请实施例对此不作具体的限定。

因此,在上述方案中,将现有技术中的多通道线性预测滤波器,分解为时域和空域两个子滤波器参数的克罗内克积。由于经过基于克罗内克积的分解,因此去混响算法中所需要求逆的协方差矩阵的尺寸大大减小,从而使得去混响算法所需要的计算量随之减小,进而较低了计算的复杂度。

请参照图4,图4为本申请实施例提供的一种去混响装置的结构框图,该去混响装置可以包括:获取模块401,用于获取麦克风阵列采集的混响信号;其中,所述混响信号为声源信号经过多次反射产生的信号;第一确定模块402,用于根据所述声源信号、所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法,确定所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,以使代价函数的值最小;其中,所述去混响算法包括第一子滤波器参数以及第二子滤波器参数,所述第一子滤波器参数以及所述第二子滤波器参数之间运用克罗内克积运算;第二确定模块403,用于根据所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,确定所述混响信号对应的期望信号的估计值为去混响后的声音信号。

在本申请实施例中,将现有技术中的多通道线性预测滤波器,分解为时域和空域两个子滤波器参数的克罗内克积。由于经过基于克罗内克积的分解,因此去混响算法中所需要求逆的协方差矩阵的尺寸大大减小,从而使得去混响算法所需要的计算量随之减小,进而较低了计算的复杂度。

进一步的,所述第一确定模块402还用于:根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值;根据所述期望信号的估计值确定所述声源信号的方差;根据所述期望信号的估计值以及所述方差确定所述声源信号的两个子协方差矩阵以及一个子协方差向量;根据所述子协方差矩阵以及所述子协方差向量确定新的第一子滤波器的值以及新的第二子滤波器的值;以所述新的第一子滤波器的值为所述第一子滤波器参数的初始值以及以所述新的第二子滤波器的值为所述第二子滤波器参数的初始值,执行所述根据所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法计算所述声源信号对应的期望信号的估计值的步骤,直至所述去混响算法满足预设条件,并得到所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值。

进一步的,所述第一确定模块402还用于:利用如下公式计算所述期望信号的估计值:

其中,为所述期望信号的估计值,g1为所述第一子滤波器参数,长为l,g2为所述第二子滤波器参数,长为m,y(n)为第n帧的观测信号向量,为长为ml的观测信号向量,d为预测时延,l为第一子滤波器参数的阶数,m为所述麦克风的数量。

进一步的,所述第一确定模块402还用于:利用如下公式计算所述声源信号的两个子协方差矩阵:

其中,为大小为l×l的子协方差矩阵,为大小为m×m的子协方差矩阵,是长为l的向量,为尺寸为ml×l的矩阵,是长为m的向量,为尺寸为ml×m的矩阵,g1为所述第一子滤波器参数,长为l,g2为所述第二子滤波器参数,长为m,il为尺寸为l×l的单位矩阵,im为尺寸为m×m的单位矩阵,y(n)为第n帧的观测信号向量,为长为ml的观测信号向量,d为预测时延,l为第一子滤波器参数的阶数,m为所述麦克风的数量,为所述方差,为所述期望信号的估计值。

进一步的,所述第一确定模块402还用于:利用如下公式计算所述声源信号的一个子协方差向量:

其中,为长为l的所述子协方差向量,是长为l的向量,为尺寸为ml×l的矩阵,为长为ml的观测信号向量,il为尺寸为l×l的单位矩阵,l为第一子滤波器参数的阶数,m为所述麦克风的数量,d为预测时延,为所述方差,为所述期望信号的估计值。

进一步的,所述第一确定模块402还用于:利用如下公式计算所述新的第一子滤波器的值以及所述新的第二子滤波器的值:

其中,g1(1)为所述新的第一子滤波器的值,g2(1)为所述新的第二子滤波器的值,为大小为m×m的子协方差矩阵,为大小为l×l的子协方差矩阵,为长为l的所述子协方差向量,是长为l的向量,为尺寸为ml×l的矩阵,是长为m的向量,为尺寸为ml×m的矩阵,g1为所述第一子滤波器参数,长为l,g2为所述第二子滤波器参数,长为m,il为尺寸为l×l的单位矩阵,im为尺寸为m×m的单位矩阵,y(n)为第n帧的观测信号向量,为长为ml的观测信号向量,d为预测时延,l为所述第一子滤波器参数的阶数,m为所述麦克风的数量,d为短时傅里叶变换域中能够对应于期望方向的导向适量或者相对早期传递函数。

进一步的,所述去混响装置400还包括:第一变换模块,用于对所述声源信号进行傅里叶变换;估计模块,用于根据所述傅里叶变换后的信号构建期望信号模型,并根据所述期望信号模型估计出对应的期望信号;第二变换模块,用于基于所述克罗内克积运算对所述期望信号模型进行变换,得到所述去混响算法;第三确定模块,用于根据所述去混响算法确定去混响输出信号;第四确定模块,用于根据所述去混响输出信号确定所述代价函数。

请参照图5,图5为本申请实施例提供的一种电子设备的结构框图,该电子设备500包括:至少一个处理器501,至少一个通信接口502,至少一个存储器503和至少一个通信总线504。其中,通信总线504用于实现这些组件直接的连接通信,通信接口502用于与其他节点设备进行信令或数据的通信,存储器503存储有处理器501可执行的机器可读指令。当电子设备500运行时,处理器501与存储器503之间通过通信总线504通信,机器可读指令被处理器501调用时执行上述去混响方法。

例如,本申请实施例的处理器501通过通信总线504从存储器503读取计算机程序并执行该计算机程序可以实现如下方法:步骤s201:获取麦克风阵列采集的混响信号。步骤s202:根据声源信号、第一子滤波器参数的初始值、第二子滤波器参数的初始值以及去混响算法,确定第一子滤波器参数的确定值以及第二子滤波器参数的确定值,以使代价函数的值最小。步骤s203:根据第一子滤波器参数的确定值以及第二子滤波器参数的确定值,确定混响信号对应的期望信号的估计值为去混响后的声音信号。

处理器501可以是一种集成电路芯片,具有信号处理能力。上述处理器501可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中公开的各种方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器503可以包括但不限于随机存取存储器(randomaccessmemory,ram),只读存储器(readonlymemory,rom),可编程只读存储器(programmableread-onlymemory,prom),可擦除只读存储器(erasableprogrammableread-onlymemory,eprom),电可擦除只读存储器(electricerasableprogrammableread-onlymemory,eeprom)等。

可以理解,图5所示的结构仅为示意,电子设备500还可包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。图5中所示的各组件可以采用硬件、软件或其组合实现。于本申请实施例中,电子设备500可以是,但不限于台式机、笔记本电脑、智能手机、智能穿戴设备、车载设备等实体设备,还可以是虚拟机等虚拟设备。另外,电子设备500也不一定是单台设备,还可以是多台设备的组合,例如服务器集群,等等。

本申请实施例还提供一种计算机程序产品,包括存储在非暂态计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,计算机能够执行上述实施例中去混响方法的步骤,例如包括:获取麦克风阵列采集的混响信号;根据所述声源信号、所述第一子滤波器参数的初始值、所述第二子滤波器参数的初始值以及所述去混响算法,确定所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,以使代价函数的值最小;其中,所述去混响算法包括第一子滤波器参数以及第二子滤波器参数,所述第一子滤波器参数以及所述第二子滤波器参数之间运用克罗内克积运算;根据所述第一子滤波器参数的确定值以及所述第二子滤波器参数的确定值,确定所述混响信号对应的期望信号的估计值为去混响后的声音信号。

在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips