HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

语音识别方法、装置和系统与流程

2021-01-28 13:01:19|302|起点商标网
语音识别方法、装置和系统与流程

本发明涉及语音识别技术领域,特别涉及语音识别方法、装置和系统。



背景技术:

由于家用电器设备发出的各种噪声以及环境中的噪声,都会对语音识别造成不同的影响,因此,语音识别降噪是非常有必要的。目前,语音识别系统拾取音频信号(包含有噪声信号和语音信号)后,根据算法识别噪声特征,从音频信号中将噪声信号滤除,即只保留语音信号进行后续的语音识别。

申请号为201911369839.1的中国发明专利申请公开了一种语音采集和识别的控制系统及其实现方法,其发明的主要特征是提供了一种低功耗并且具有主动降噪功能的语音采集和语音识别的控制系统,可以降低语音识别给系统带来的功耗负担,并且可实现系统的主动降噪,提高语音识别成功率。

针对现有语音识别方法只能滤除所拾取音频信号中的噪声信号,并不能降低语音识别过程中的噪声信号,因此,当拾取的噪声信号比较复杂时,语音识别的结果准确性比较低。



技术实现要素:

本发明提供了语音识别方法、装置和系统,能够提高语音识别的准确性。

第一方面,本发明实施例提供了语音识别方法,包括:

接收外部的第一采集模块发来的第一噪声信号;

根据所述第一噪声信号,生成第二噪声信号;

将所述第二噪声信号发送给外部的转换模块,以使所述转换模块播放根据所述第二噪声信号生成的降噪音频信号,其中,所述降噪音频信号与所述第一噪声信号叠加后的噪声信号的振幅小于所述第一噪声信号的振幅;

接收外部的第二采集模块发来的待识别音频信号,对所述待识别音频信号进行识别,其中,所述待识别音频信号中包括所述第一噪声信号与所述降噪音频信号叠加后的噪声信号。

在一种可能的设计中,所述根据所述第一噪声信号,生成第二噪声信号,包括:

确定所述第一噪声信号的第一频谱;

根据所述第一频谱,生成第二频谱,其中,所述第二频谱与所述第一频谱相位相反;

根据所述第二频谱,生成所述第二噪声信号,其中,所述第一噪声信号与所述第二噪声信号振幅相同相位相反。

在一种可能的设计中,

所述转换模块中包括fir滤波器;

所述fir滤波器,用于根据所述第二噪声信号生成所述降噪音频信号;

所述对所述待识别音频信号进行识别,包括:

解析出所述待识别音频信号中的第三噪声信号;

在所述对所述待识别音频信号进行识别之后,进一步包括:

判断所述第三噪声信号是否收敛,如果不是,则确定所述第三噪声信号的第三频谱,根据所述第一频谱、所述第二频谱和所述第三频谱,生成所述fir滤波器的修正系数,利用所述修正系数对所述fir滤波器进行调整。

第二方面,本发明实施例还提供了语音识别装置,包括:处理单元、发送单元和识别单元;

所述处理单元,用于接收外部的第一采集模块发来的第一噪声信号,并根据所述第一噪声信号生成第二噪声信号;

所述发送单元,用于将所述处理单元生成的所述第二噪声信号发送给外部的转换模块,以使所述转换模块播放根据所述第二噪声信号生成的降噪音频信号,其中,所述降噪音频信号与所述第一噪声信号叠加后的噪声信号的振幅小于所述第一噪声信号的振幅;

所述识别单元,用于接收外部的第二采集模块发来的待识别音频信号,对所述待识别音频信号进行识别,其中,所述待识别音频信号中包括所述第一噪声信号与所述降噪音频信号叠加后的噪声信号。

在一种可能的设计中,

所述处理单元,用于执行如下处理:

确定所述第一噪声信号的第一频谱;

根据所述第一频谱,生成第二频谱,其中,所述第二频谱与所述第一频谱相位相反;

根据所述第二频谱,生成所述第二噪声信号,其中,所述第一噪声信号与所述第二噪声信号振幅相同相位相反。

在一种可能的设计中,

所述转换模块中包括fir滤波器,其中,所述fir滤波器,用于根据所述第二噪声信号生成所述降噪音频信号;

所述识别单元,用于解析出所述待识别音频信号中的第三噪声信号;

该语音识别装置进一步包括:调整单元;

所述调整单元,用于判断所述识别单元解析出的所述第三噪声信号是否收敛,如果所述第三噪声信号不收敛,则确定所述第三噪声信号的第三频谱,根据所述第一频谱、所述第二频谱和所述第三频谱,生成所述fir滤波器的修正系数,利用所述修正系数对所述fir滤波器进行调整。

第三方面,本发明实施例还提供了语音识别系统,包括:上述第二方面或第二方面的任一可能的实现方式所提供的语音识别装置、第一采集模块、转换模块和第二采集模块;

所述第一采集模块,用于采集第一噪声信号,并将所述第一噪声信号发送给所述语音识别装置;

所述转换模块,用于接收来自所述语音识别装置发送的第二噪声信号,根据所述第二噪声信号,生成降噪音频信号,并播放所述降噪音频信号,其中,所述降噪音频信号与所述第一噪声信号叠加后的噪声信号的振幅小于所述第一噪声信号的振幅;

所述第二采集模块,用于采集待识别音频信号,并将所述待识别音频信号发送给所述语音识别装置,其中,所述待识别音频信号中包括所述第一噪声信号与所述降噪音频信号叠加后的噪声信号。

在一种可能的设计中,

当所述语音识别系统部署在目标设备上时,所述第一采集模块与所述目标设备发出噪声的目标部位之间的距离小于预设值;

所述第一采集模块用于对所述目标部位进行噪声采集,获得所述第一噪声信号,其中,所述第一噪声信号中包括所述目标部位发出的噪声;

所述第一采集模块包括:麦克风、第一信号放大器、第一低通滤波器和第一模拟-数字转换器,

其中,所述麦克风用于将所采集到的第一噪声转换成第一噪声模拟信号;

所述第一信号放大器用于放大所述第一噪声模拟信号;

所述第一低通滤波器用于对所述第一信号放大器放大后的所述第一噪声模拟信号进行低通滤波,输出滤波后的模拟信号;

所述第一模拟-数字转换器用于将所述低通滤波器滤波后的模拟信号转换成所述第一噪声信号,所述第一噪声信号为数字信号;

所述转换模块包括:fir滤波器、数字-模拟转换器、第二低通滤波器、功放器和扬声器,

其中,所述fir滤波器用于根据所述第二噪声信号生成所述降噪音频信号,所述第二噪声信号和所述降噪音频信号均为数字信号;

所述数字-模拟转换器用于将数字信号格式的降噪音频信号转换成模拟信号格式的降噪音频信号;

所述第二低通滤波器用于对模拟信号格式的降噪音频信号进行低通滤波;

所述功放器用于对滤波后的降噪音频信号进行放大;

所述扬声器用于播放所述功放器放大后的降噪音频信号;

所述第二采集模块包括:麦克风阵列、第二信号放大器、第三低通滤波器和第二模拟-数据转换器,

其中,所述麦克风阵列用于将采集到的待识别声音转换成待识别模拟信号;

所述第二信号放大器用于放大所述待识别模拟信号;

所述第三低通滤波器用于对所述待识别模拟信号进行低通滤波;

所述第二模拟-数据转换器用于滤波后的所述待识别模拟信号转换成待识别音频信号,所述待识别音频信号为数字信号。

第四方面,本发明实施例还提供了智能设备,包括:至少一个存储器和至少一个处理器;

所述至少一个存储器,用于存储机器可读程序;

所述至少一个处理器,用于调用所述机器可读程序,执行上述第一方面或第一方面的任一可能的实现方式所提供的语音识别方法。

第五方面,本发明实施例还提供了计算机可读介质,

所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行上述第一方面或第一方面的任一可能的实现方式所提供的语音识别方法。

由上述技术方案可知,本发明实施例提供的语音识别方法根据接收到的第一噪声信号生成第二噪声信号,并由外部转换模块播放根据该第二噪声信号生成的降噪音频信号,并且对来自第二采集模块的待识别音频信号进行识别。由上述可知,降噪音频信号和第一噪声信号叠加后的噪声信号的振幅小于第一噪声信号的振幅,因此,接收到的待识别音频信号中的噪声信号的振幅小于第一噪声信号的振幅,从而实现了语音识别系统的主动降噪,从而使得语音识别的结果更加准确。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一个实施例提供的一种语音识别方法的流程图;

图2是本发明一个实施例提供的一种语音识别装置所在设备的示意图;

图3是本发明一个实施例提供的一种语音识别装置的示意图;

图4是本发明一个实施例提供的另一种语音识别装置的示意图;

图5是本发明一个实施例提供的一种语音识别系统的示意图;

图6是本发明一个实施例提供的另一种语音识别方法的流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本发明实施例提供了一种语音识别方法,该方法可以包括如下步骤:

步骤101:接收外部的第一采集模块发来的第一噪声信号;

步骤102:根据第一噪声信号,生成第二噪声信号;

步骤103:将第二噪声信号发送给外部的转换模块,以使转换模块播放根据第二噪声信号生成的降噪音频信号;

步骤104:接收外部的第二采集模块发来的待识别音频信号,对待识别音频信号进行识别。

在本发明实施例中,本发明实施例提供的语音识别方法根据接收到的第一噪声信号生成第二噪声信号,并由外部转换模块播放根据该第二噪声信号生成的降噪音频信号,并且对来自第二采集模块的待识别音频信号进行识别。由上述可知,降噪音频信号和第一噪声信号叠加后的噪声信号的振幅小于第一噪声信号的振幅,因此,接收到的待识别音频信号中的噪声信号的振幅小于第一噪声信号的振幅,从而实现了语音识别系统的主动降噪,从而使得语音识别的结果更加准确。

需要说明的是,在本发明实施例中,第一采集模块包括麦克风、第一信号放大器、第一低通滤波器和第一模拟-数字转换器,其中麦克风用于将所采集到的第一噪声转换成第一噪声模拟信号,第一信号放大器用于放大第一噪声模拟信号,第一低通滤波器用于对第一信号放大器放大后的第一噪声模拟信号进行低通滤波,输出滤波后的模拟信号,第一模拟-数字转换器用于将低通滤波器滤波后的模拟信号转换成第一噪声信号。在本发明实施例中,将麦克风放置在目标设备主要噪声源的位置,当目标设备开机工作后,麦克风接收到的第一噪声依次经过第一信号放大器、第一低通滤波器和第一模拟-数字转换器转变为第一噪声信号,该第一噪声信号为数字信号。

可以理解的是,在本发明实施例中,目标设备例如可以是家用电器,如冰箱、空调、冰柜等,也可以是与本发明实施例提供的具有相同结构的其他电器。

需要说明的是,在本发明实施例中,转换模块包括fir滤波器、数字-模拟转换器、第二低通滤波器、功放器和扬声器,fir滤波器用于根据第二噪声信号生成降噪音频信号,数字-模拟转换器用于将数字信号格式的降噪音频信号转换成模拟信号格式的降噪音频信号,第二低通滤波器用于对模拟信号格式的降噪音频信号进行低通滤波,功放器用于对滤波后的降噪音频信号进行放大,扬声器用于播放功放器放大后的降噪音频信号。在本发明实施例中,第二噪声信号依次经过fir滤波器、数字-模拟转换器、第二低通滤波器、功放器和扬声器转变成降噪音频信号,以由扬声器播放该降噪声音,该第二噪声信号和降噪音频信号均为数字信号。

需要说明的是,在本发明实施例中,第二采集模块包括麦克风阵列、第二信号放大器、第三低通滤波器和第二模拟-数据转换器,其中,麦克风阵列用于将采集到的待识别声音转换成待识别模拟信号,第二信号放大器用于放大待识别模拟信号,第三低通滤波器用于对待识别模拟信号进行低通滤波,第二模拟-数据转换器用于滤波后的待识别模拟信号转换成待识别音频信号。在本发明实施例中,麦克风阵列的放置位置尽量远离目标设备主要噪声源的位置,麦克风阵列接收到待识别声音中包含有第一噪声和降噪音频叠加之后的声音,还可以包含有输入的语音命令,麦克风阵列接收到的待识别声音依次经过第二信号放大器、第三低通滤波器和第二模拟-数据转换器转变为待识别音频信号,该待识别音频信号为数字信号。

另外需要说明的是,在本发明实施例中,第一采集模块中的麦克风接收第一噪声与转换模块播放降噪声音之间的时间间隔小于0.1秒。如果两者的时间间隔小于0.1秒,则第二采集模块中麦克风阵列所采集到的第一噪声和降噪声音叠加后的噪声振幅小于第一噪声的振幅,也就是说麦克风阵列所采集到的是两者叠加消音后的噪声,从而实现了语音识别系统的主动降噪,降低了待识别音频信号中的噪声,从而使得语音识别的结果更加准确。如果两者的时间间隔大于或者等于0.1秒,则第二采集模块中麦克风阵列所采集到的噪声包括有第一噪声和降噪声音这两种声音,也就是说麦克风阵列所采集到的噪声是两者叠加后的噪声,从而增大了语音识别系统中的噪声,因此也会导致语音识别的结果准确定较低。

在本发明的一种实施例中,基于图1所示的语音识别方法,步骤102根据第一噪声信号,生成第二噪声信号,具体可以包括如下步骤:

确定第一噪声信号的第一频谱;

根据第一频谱,生成第二频谱,其中,第二频谱与第一频谱相位相反;

根据第二频谱,生成第二噪声信号,其中,第一噪声信号与第二噪声信号振幅相同相位相反。

在本发明实施例中,根据第一噪声信号的第一频谱生成与第一频谱相位相反的第二频谱,并根据第一频谱生成与第一噪声信号振幅相同且相位相反的第二噪声信号。如此设置,可使第一噪声信号与第二噪声信号叠加后的噪声信号的振幅低于第一噪声信号的振幅,从而实现了主动降噪。

需要说明的是,在本发明实施例中,第一噪声信号为数字信号,利用傅里叶变换分析出第一噪声信号的第一频谱,经过反傅里叶变换改变第一频谱中每个频率的相位生成第二频谱并输出与第一噪声信号振幅相同且相位相反的第二噪声信号。

在本发明的一种实施例中,基于图1所示的语音识别方法,

转换模块中包括fir滤波器,其中,fir滤波器用于根据第二噪声信号生成降噪音频信号,

步骤104对待识别音频信号进行识别,包括:

解析出待识别音频信号中的第三噪声信号;

在本发明实施例中,利用傅里叶变换分析待识别音频信号的频谱,并通过语音识别算法将待识别音频信号中的第三噪声信号和语音信号进行分离,其中第三噪声信号包括第一噪声信号与第二噪声信号叠加后产生的噪声信号,还可以包括第二采集模块接收到的环境噪声。分离后的语音信号可以通过逻辑部分生成语音播报信号,并经过转换模块最终输出,进而实现对目标设备的语音控制。由于第三噪声信号中的第一噪声信号与第二噪声信号叠加后的噪声的振幅小于第一噪声信号,因此对待识别音频信号中第三噪声信号和语音信号的分离速度快且结果更加准确。因此,通过主动降噪,使得所采集到的语音信号更加清晰,有助于提高语音识别能力,因此提高了语音识别结果的准确性。

在步骤104对待识别音频信号进行识别之后,进一步包括:

判断第三噪声信号是否收敛,如果不是,则确定第三噪声信号的第三频谱,根据第一频谱、第二频谱和第三频谱,生成fir滤波器的修正系数,利用修正系数对fir滤波器进行调整。

在本发明实施例中,判断第三噪声信号是否收敛,如果不是,则确定第三噪声信号的第三频谱,利用算法计算得到fir滤波器的修正系数,并利用得到的修正系数对fir滤波器进行调整,从而使得第二采集模块接收到的待识别音频信号中的第一噪声与降噪声音的振幅越来越小,也就是说,可以提高主动降噪的效果。

需要说明的是,在本发明实施例中,fir滤波器又称有限长单位冲激响应滤波器,是非递归型滤波器的总称,当前输出样本仅是过去和现在输入样本的函数,其系统冲激响应是一个有限长序列,具有很好的线性相位,无相位失真,稳定性较好。对于一组固定的权系数来说,fir滤波器输出信号等于输入矢量的各元素的线性加权之和,然而实际上权系数是可调的,调整权系数的过程叫做自适应过程。

另外需要说明的是,在本发明实施例中,例如可以利用最小均方误差(leastmeansquare,lms)算法对第一频谱、第二频谱和第三频谱进行计算生成fir滤波器的修正系数。lms算法基于维纳滤波理论,采用瞬时值估计梯度矢量的算法,通过最小化误差信号的能量来更新自适应滤波器的权系数。在本发明实施例中,可以通过如下第一式子得到滤波器的更新修正系数:

第一式子:

w(n+1)=w(n)+ke(n)x(n)

其中,w(n+1)用于表征fir滤波器的更新修正系数,w(n)用于表征fir滤波器的修正系数,x(n)用于表征输入fir滤波器的输入信号,e(n)用于表征输入信号与根据输入信号所输出实际信号之间的差值,k用于表征步长系数。

如图2、图3所示,本发明实施例提供了一种语音识别装置。语音识别装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图2所示,为本发明实施例提供的语音识别装置所在设备的一种硬件结构图,除了图2所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图3所示,作为一个逻辑意义上的装置,是通过其所在设备的cpu将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。

如图3所示,本发明实施例提供了一种语音识别装置,包括:处理单元301、发送单元302和识别单元303;

处理单元301,用于接收外部的第一采集模块发来的第一噪声信号,并根据第一噪声信号生成第二噪声信号;

发送单元302,用于将处理单元301生成的第二噪声信号发送给外部的转换模块,以使转换模块播放根据第二噪声信号生成的降噪音频信号,其中,降噪音频信号与第一噪声信号叠加后的噪声信号的振幅小于第一噪声信号的振幅;

识别单元303,用于接收外部的第二采集模块发来的待识别音频信号,对待识别音频信号进行识别,其中,待识别音频信号中包括第一噪声信号与降噪音频信号叠加后的噪声信号。

在本发明的一种实施例中,基于图3所示的语音识别装置,

处理单元301,用于执行如下处理:

确定第一噪声信号的第一频谱;

根据第一频谱,生成第二频谱,其中,第二频谱与第一频谱相位相反;

根据第二频谱,生成第二噪声信号,其中,第一噪声信号与第二噪声信号振幅相同相位相反。

在本发明的一种实施例中,基于图3所示的语音识别装置,

转换模块中包括fir滤波器,其中,fir滤波器用于根据第二噪声信号生成降噪音频信号;

识别单元303,用于解析出待识别音频信号中的第三噪声信号;

如图4所示,该语音识别装置,进一步包括:调整单元401;

调整单元401,用于判断识别单元303解析出的第三噪声信号是否收敛,如果第三噪声信号不收敛,则确定第三噪声信号的第三频谱,根据第一频谱、第二频谱和第三频谱,生成fir滤波器的修正系数,利用修正系数对fir滤波器进行调整。

如图5所示,本发明一个实施例提供了语音识别系统,包括:上述任一实施例所提供的语音识别装置501、第一采集模块502、转换模块503和第二采集模块504;

第一采集模块502,用于采集第一噪声信号,并将第一噪声信号发送给语音识别装置501;

转换模块503,用于接收来自语音识别装置501发送的第二噪声信号,根据第二噪声信号,生成降噪音频信号,并播放降噪音频信号,其中,降噪音频信号与第一噪声信号叠加后的噪声信号的振幅小于第一噪声信号的振幅;

第二采集模块504,用于采集待识别音频信号,并将待识别音频信号发送给语音识别装置501,其中,待识别音频信号中包括第一噪声信号与降噪音频信号叠加后的噪声信号。

在本发明的一种实施例中,基于图5所示的语音识别系统,

当语音识别系统部署在目标设备上时,第一采集模块502与目标设备发出噪声的目标部位之间的距离小于预设值;

第一采集模块502用于对目标部位进行噪声采集,获得第一噪声信号,其中,第一噪声信号中包括目标部位发出的噪声;

第一采集模块502包括:麦克风、第一信号放大器、第一低通滤波器和第一模拟-数字转换器,

其中,麦克风用于将所采集到的第一噪声转换成第一噪声模拟信号;

第一信号放大器用于放大第一噪声模拟信号;

第一低通滤波器用于对第一信号放大器放大后的第一噪声模拟信号进行低通滤波,输出滤波后的模拟信号;

第一模拟-数字转换器用于将低通滤波器滤波后的模拟信号转换成第一噪声信号,第一噪声信号为数字信号;

转换模块503包括:fir滤波器、数字-模拟转换器、第二低通滤波器、功放器和扬声器,

其中,fir滤波器用于根据第二噪声信号生成降噪音频信号,第二噪声信号和降噪音频信号均为数字信号;

数字-模拟转换器用于将数字信号格式的降噪音频信号转换成模拟信号格式的降噪音频信号;

第二低通滤波器用于对模拟信号格式的降噪音频信号进行低通滤波;

功放器用于对滤波后的降噪音频信号进行放大;

扬声器用于播放功放器放大后的降噪音频信号;

第二采集模块504包括:麦克风阵列、第二信号放大器、第三低通滤波器和第二模拟-数据转换器,

其中,麦克风阵列用于将采集到的待识别声音转换成待识别模拟信号;

第二信号放大器用于放大待识别模拟信号;

第三低通滤波器用于对待识别模拟信号进行低通滤波;

第二模拟-数据转换器用于滤波后的待识别模拟信号转换成待识别音频信号,待识别音频信号为数字信号。

需要说明的是,在本发明实施例中,目标设备例如可以是家用电器,如冰箱、空调、冰柜等,也可以是与本发明实施例提供的具有相同结构的其他电器。例如,当目标设备为冰箱时,将第一采集模块部署在尽量靠近该冰箱主要噪声源的位置,当冰箱开机工作后,第一采集模块中的麦克风采集到的第一噪声信号主要为该冰箱的主要噪声源所发出的噪声。通过语音识别装置生成与第一噪声信号振幅相同但相位相反的降噪音频信号并利用扬声器进行播放,扬声器所播放的降噪声与冰箱主要噪声发出的噪声混合后可以相互抵消,生成振幅小于第一噪声信号的噪声,实现主动降噪。此外,第二采集模块中的麦克风阵列除了可以采集输入的语音指令,还可以作为监听麦克风,采集扬声器所播放的降噪声与冰箱主要噪声发出的噪声混合后的噪声信号,并通过语音识别装置根据混合后的噪声信号调整fir滤波器,因此,将第二采集模块部署尽量远离该冰箱主要噪声源的位置,避免了因麦克风阵列采集到第一噪声信号而导致的误差,从而有助于提高语音识别系统主动降噪的效果。

需要说明的是,本发明实施例示意的结构并不构成对语音识别装置的具体限定。在本发明的另一些实施例中,该语音识别装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。

上述装置内的各模块之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。

下面结合图5所示的语音识别系统,对本发明实施例提供的语音识别方法作进一步的详细说明,如图6所示,该方法可以包括如下步骤:

步骤601:第一采集模块采集第一噪声信号,并将第一噪声信号发送给语音识别装置。

在本发明实施例中,第一噪声信号为数字信号,第一采集模块包含有麦克风、第一信号放大器、第一低通滤波器和第一模拟-数字转换器,麦克风放置在目标设备主要噪声源的位置,当目标设备开机工作后,麦克风将接收到的第一噪声经过第一信号放大器、第一低通滤波器和第一模拟-数字转换器转变为第一噪声信号,并将该第一噪声信号发送给语音识别装置。

步骤602:语音识别装置确定第一噪声信号的第一频谱。

在本步骤中,语音识别装置接收到来自第一采集模块的第一噪声信号后,利用傅里叶变换分析出该第一噪声信号的第一频谱。

步骤603:语音识别装置生成第二噪声信号。

在步骤中,语音识别装置确定第一噪声信号的第一频谱后,通过反傅里叶变换改变第一频谱中每个频率的相位生成第二频谱,并根据第二频谱生成与该第一噪声信号振幅相同且相位相反的第二噪声信号,其中第二噪声信号为数字信号。

步骤604:转换模块播放根据第二噪声信号生成的降噪音频信号。

在本发明实施例中,转换模块包括fir滤波器、数字-模拟转换器、第二低通滤波器、功放器和扬声器,语音识别装置将生成的第二噪声信号输出后,该第二噪声信号依次经过fir滤波器、数字-模拟转换器、第二低通滤波器、功放器和扬声器转变成降噪音频信号,并由扬声器播放,其中降噪音频信号为数字信号。

步骤605:第二采集模块采集待识别音频信号,并将第二噪声信号发送给语音识别装置。

在本发明实施例中,第二采集模块包括麦克风阵列、第二信号放大器、第三低通滤波器和第二模拟-数据转换器,麦克风阵列的放置位置尽量远离目标设备主要噪声源的位置,麦克风阵列接收到待识别声音中包含有第一噪声和降噪声音叠加之后的声音,还可以包含输入的语音命令以及所处环境的环境噪声,并且第一噪声和降噪声音叠加之后的声音低于第一噪声。麦克风阵列接收到的待识别声音经过第二信号放大器、第三低通滤波器和第二模拟-数据转换器转变为待识别音频信号,并将该待识别音频信号发送给语音识别装置,其中待识别音频信号为数字信号。

步骤606:语音识别装置解析待识别音频信号中的第三噪声信号。

在本步骤中,语音识别装置接收到来自第二采集模块的待识别音频信号后,利用傅里叶变换分析出待识别音频信号的频谱,并通过语音识别算法将待识别音频信号中的第三噪声信号和语音信号进行分离,其中第三噪声信号包括第一噪声信号与第二噪声信号叠加后产生的噪声信号,还可以包括第二采集模块接收到的环境噪声,分离后的语音信号可以通过逻辑部分生成语音播报信号,并经过转换模块最终输出,进而实现对目标设备的语音控制。

步骤607:语音识别装置判断第三噪声信号是否收敛,如果不是,执行步骤608,否则结束当前流程。

在本步骤中,语音识别装置判断第三噪声信号是否收敛,其中收敛例如可以是在预先设定的阈值范围内的收敛,如果不是,则执行步骤608,否则结束当前流程。

步骤608:语音识别装置调整fir滤波器的修正系数。

在本步骤中,语音识别装置可以根据第一频谱、第二频谱和第三频谱,生成fir滤波器的更新修正系数,并利用该更新修正系数对fir滤波器进行调整,具体可以通过如下第一式子生成fir滤波器的更新修正系数:

第一式子:

w(n+1)=w(n)+ke(n)x(n)

其中,w(n+1)用于表征fir滤波器的更新修正系数,w(n)用于表征fir滤波器的修正系数,x(n)用于表征输入fir滤波器的输入信号,e(n)用于表征输入信号与根据输入信号所输出实际信号之间的差值,k用于表征步长系数。

本发明实施例还提供了智能设备,包括:至少一个存储器和至少一个处理器;

所述至少一个存储器,用于存储机器可读程序;

所述至少一个处理器,用于调用所述机器可读程序,执行本发明任一实施例中的语音识别方法。

本发明实施例还提供了计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行本发明任一实施例中的语音识别方法。

在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。

用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如cd-rom、cd-r、cd-rw、dvd-rom、dvd-ram、dvd-rw、dvd+rw)、磁带、非易失性存储卡和rom。可选择地,可以由通信网络从服务器计算机上下载程序代码。

此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。

此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展模块中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展模块上的cpu等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。

需要说明的是,上述各流程和各系统结构图中不是所有的步骤和单元都是必须的,可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的,可以根据需要进行调整。上述各实施例中描述的系统结构可以是物理结构,也可以是逻辑结构,即,有些单元可能由同一物理实体实现,或者,有些单元可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。

以上各实施例中,硬件模块可以通过机械方式或电气方式实现。例如,一个硬件模块可以包括永久性专用的电路或逻辑(如专门的处理器,fpga或asic)来完成相应操作。硬件模块还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。

上文通过附图和优选实施例对本发明进行了详细展示和说明,然而本发明不限于这些已揭示的实施例,基与上述多个实施例本领域技术人员可以知晓,可以组合上述不同实施例中的代码审核手段得到本发明更多的实施例,这些实施例也在本发明的保护范围之内。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips