HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

音频信号的处理方法、装置、终端及存储介质与流程

2021-01-28 12:01:57|289|起点商标网
音频信号的处理方法、装置、终端及存储介质与流程

本公开涉及终端技术领域,尤其涉及音频信号的处理方法、装置、终端及存储介质。



背景技术:

相关技术中,终端在进行语音识别时,若同时来自多个位置范围的多个人同时讲话时,语音识别会将讲话内容全部进行识别,无法实现对不同讲话者的区分识别。例如,围成一起的会议中,若存在两个不同范围内的人同时讲话,那么在语音识别中,会将两个人的讲话内容同时进行识别,影响用户体验。



技术实现要素:

本公开提供一种音频信号的处理方法、装置、终端及存储介质。

根据本公开实施例的第一方面,提供一种音频信号的处理方法,应用于终端,包括:

通过声音采集模组采集音频信号;

根据声音参数,确定采集到的所述音频信号的声源位置是否位于预设范围内;

当所述声源位置位于所述预设范围内时,识别所述音频信号。

可选地,所述根据声音参数,确定采集到的所述音频信号的声源位置是否位于预设范围内,包括:

根据n个中任意两个所述声音采集模组采集到的同一声源的同一声音的声音参数,确定声音参数差异,其中,n为大于或等于2的正整数;

若所述声音参数差异位于所述任意两个所述声音采集模组所确定的预设差异范围内,则确定所述音频信号的声源位置位于所述预设范围内;

若所述声音参数差异未位于所述任意两个所述声音采集模组所确定的预设差异范围内,则确定所述音频信号的声源位置未位于所述预设范围内。

可选地,所述任意两个所述声音采集模组确定的预设差异范围,包括:位于所述预设范围内不同位置上的声源发出的同一声音到达所述任意两个所述声音采集模组所产生的声音参数差异所形成的差异范围。

可选地,所述n为大于2的正整数时,

所述根据所述声音参数差异,确定采集到的所述音频信号的声源位置信息是否位于所述预设范围内,包括:

根据m组声音采集模组针对同一声源的同一声音的所述声音参数差异,确定采集到的所述音频信号的声源位置是否位于所述预设范围内;其中,m为大于或等于2且小于或等于的正整数,一组所述声音采集模组包括两个所述声音采集模组,不同组的所述声音采集模组之间至少一个所述声音采集模组不同。

可选地,所述根据m组声音采集模组针对同一声源的同一声音的所述声音参数差异,确定所述音频信号的声源位置是否位于预设范围内,包括:

根据m个组的所述声音采集模组对同一声源的同一声音的m个所述声音参数差异,分别确定是否落入对应组的所述声音采集模组的差异范围内以获得m个结果,其中,m为小于或等于m且大于或等于1的正整数;

根据m个所述结果,确定所述音频信号的声源位置是否位于所述预设范围内。

可选地,所述根据声音参数,确定音频信号的声源位置是否位于预设范围内,包括:

根据同一声源的同一声音到达第一声音采集模组的第一到达时刻,以及到达第二声音采集模组的第二到达时刻,确定出到达时间差;

判断所述到达时间差是否位于所述第一声音采集模组与所述第二声音采集模组对应的预设时间差范围内;

若位于,则确定所述音频信号的声源位置位于所述预设范围内;

若未位于,则确定所述音频信号的声源位置未位于所述预设范围内。

可选地,所述方法还包括:

根据所述预设范围,确定所述预设范围的两个边界点;

确定位于第一边界点的第一声源发出的同一声音达到所述第一声音采集模组的第一时间信息;以及到达所述第二声音采集模组的第二时间信息;根据所述第一时间信息与所述第二时间信息,确定第一时间差;

确定位于第二边界点的第二声源发出的同一声音到达所述第一声音采集模组的第三时间信息,以及到达所述第二声音采集模组的第四时间信息;根据所述第三时间信息与所述第四时间信息,确定第二时间差;

根据所述第一时间差与所述第二时间差,确定出所述预设时间差范围。

根据本公开实施例的第二方面,提供一种音频信号的处理装置,应用于终端,包括:

采集模块,被配置为通过声音采集模组采集音频信号;

第一确定模块,被配置为根据声音参数,确定采集到的所述音频信号的声源位置是否位于预设范围内;

识别模块,被配置为当所述声源位置位于所述预设范围内时,识别所述音频信号。

可选地,所述第一确定模块,还被配置为:

根据n个中任意两个所述声音采集模组采集到的同一声源的同一声音的声音参数,确定声音参数差异,其中,n为大于或等于2的正整数;

若所述声音参数差异位于所述任意两个所述声音采集模组所确定的预设差异范围内,则确定所述音频信号的声源位置位于所述预设范围内;

若所述声音参数差异未位于所述任意两个所述声音采集模组所确定的预设差异范围内,则确定所述音频信号的声源位置未位于所述预设范围内。

可选地,所述任意两个所述声音采集模组确定的预设差异范围,包括:位于所述预设差异范围内不同位置上的声源发出的同一声音到达所述任意两个所述声音采集模组所产生的声音参数差异所形成的差异范围。

可选地,所述n为大于2的正整数时,

所述第一确定模块,还被配置为:

根据m组声音采集模组针对同一声源的同一声音的所述声音参数差异,确定采集到的所述音频信号的声源位置是否位于所述预设范围内;其中,m为大于或等于2且小于或等于的正整数,一组所述声音采集模组包括两个所述声音采集模组,不同组的所述声音采集模组之间至少一个所述声音采集模组不同。

可选地,所述第一确定模块,还被具体配置为:

根据m个组的所述声音采集模组针对同一声源的同一声音的m个所述声音参数差异,分别确定是否落入对应组的所述声音采集模组的预设差异范围内以获得m个结果,其中,m为小于或等于m且大于或等于1的正整数;

根据m个所述结果,确定所述音频信号的声源位置是否位于所述预设范围内。

可选地,所述第一确定模块,还被具体配置为:

根据同一声源的同一声音到达第一声音采集模组的第一到达时刻,以及到达第二声音采集模组的第二到达时刻,确定出到达时间差;

判断所述到达时间差是否位于第一声音采集模组与所述第二声音采集模组对应的预设时间差范围内;

若位于,则确定所述音频信号的声源位置位于所述预设范围内;

若未位于,则确定所述音频信号的声源位置未位于所述预设范围内。

可选地,所述装置还包括:第二确定模块,其中,所述第二确定模块包括:

第一确定子模块,被配置为根据所述预设范围,确定所述预设范围的两个边界点;

第二确定子模块,被配置为确定位于第一边界点的第一声源发出的同一声音到达所述第一声音采集模组的第一时间信息;以及到达所述第二声音采集模组的第二时间信息;根据所述第一时间信息与所述第二时间信息,确定第一时间差;

第三确定子模块,被配置为确定位于第二边界点的第二声源发出的同一声音到达所述第一声音采集模组的第三时间信息,以及到达所述第二声音采集模组的第四时间信息;根据所述第三时间信息与所述第四时间信息,确定第二时间差;

第四确定子模块,被配置为根据所述所述第一时间差与所述第二时间差,确定出所述预设时间差范围。

根据本公开实施例的第三方面,提供一种终端,包括:

处理器;

用于存储所述处理器可执行指令的存储器;

其中,所述处理器被配置为:

通过声音采集模组采集音频信号;

根据声音参数,确定采集到的所述音频信号的声源位置是否位于预设范围内;

当所述声源位置位于所述预设范围内时,识别所述音频信号。

根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行实现上述任意所述的方法步骤。

本公开的实施例提供的技术方案可以包括以下有益效果:

本公开的实施例提供的音频信号的处理方法,应用于终端,通过声音采集模组采集音频信号;根据声音参数,确定采集到的所述音频信号的声源位置是否位于预设范围内;当所述声源位置位于所述预设范围内时,识别所述音频信号。因此,本公开实施例能够对声源位置在所述预设范围内的声音进行识别,减少对所述预设范围以外的声音的识别,实现了针对特定范围内的声音的识别,提升了终端的用户体验。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种音频信号的处理方法的流程图;

图2是根据一示例性实施例示出的一种音频信号的处理方法的场景示意图;

图3是根据一示例性实施例示出的一种音频信号的处理装置的框图;

图4是根据一示例性实施例示出的一种用于终端的框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种音频信号的处理方法的流程图,如图1所示,所述方法应用于终端,包括以下步骤:

步骤101:通过声音采集模组采集音频信号;

步骤102:根据声音参数,确定采集到的所述音频信号的声源位置是否位于预设范围内;

步骤103:当所述声源位置位于所述预设范围内时,识别所述音频信号。

这里,所述终端可以包括移动终端或固定终端。所述移动终端可以包括手机、平板电脑、电子阅读器、可穿戴式设备等;所述固定终端可以包括台式电脑、一体机、智能家居设备等;其中,智能家居设备可以包括智能电视、智能空调、智能冰箱等。

这里,所述声音参数,包括采集到声音的时间、采集到声音的响度和采集到声音的强度的至少之一。

本公开实施例中,所述终端可以仅识别位于所述预设范围内的所述声源位置处所发出的声音而获得的音频信号。

在一些场景下,假设终端为会议中心的移动终端或固定终端,所述预设范围为所述终端的前方预设距离内的范围,例如,该范围为可操作所述终端的范围。在该场景下,所述终端可以仅识别可操作所述终端的范围内的声音,减少预设范围以外的声音的干扰识别,提升了用户体验。

在另一些场景下,假设终端为智能电视,所述预设范围为客厅沙发所在范围,当所述智能电视接收到一个声音时,所述智能电视会根据该声音的声音参数,确定所述音频信号的声源位置,若所述声源位置在所述预设范围内,则识别所述该声音对应的音频信号。因此,通过上述方法不会识别出客厅沙发以外的范围内的声音,减少了对智能电视的误操作。

在一些实施例中,所述根据声音参数,确定采集到的所述音频信号的声源位置是否位于预设范围内,可以包括:根据n个中任意两个所述声音采集模组采集到的同一声源的同一声音的声音参数,确定声音参数差异,其中,n为大于或等于2的正整数;若所述声音参数差异位于所述任意两个所述声音采集模组所确定的预设差异范围内,则确定所述音频信号的声源位置位于所述预设范围内;若所述声音参数差异未位于所述任意两个所述声音采集模组所确定的预设差异范围内,则确定所述音频信号的声源位置未位于所述预设范围内。

可以理解的是,不同位置的声音采集模组在接收到同一声源的同一声音时,所采集的声音参数有所差异。例如,不同位置的声音采集模组由于离同一声源位置之间的距离不同,会导致接收到同一声源的同一声音的时间不同,或者,会导致接收到同一声源的同一声音的响度也可以不同,或者,会导致接收到的同一声源的同一声音的强度也可以不同。

在本实施例中,利用n个中任意两个所述声音采集模组对同一声源的同一声音所确定的声音参数差异,并根据所述声音参数差异是否位于所述任意两个所述声音采集模组所确定的预设差异范围内,来确定所述音频信号的声源位置是否位于所述预设范围内,实现起来简单,无需安装传感器例如红外探测器等来探测发声体的位置等技术,降低了终端的硬件要求,减少了终端的制作成本,及提高终端的通用性。

需要补充的是,所述预设差异范围为所述任意两个所述声音采集模组所确定的,可以预先存储在所述终端中;也可以由终端向服务器发送所述预设范围的位置信息,基于所述预设范围的位置信息接收到服务器反馈的所述预设差异范围,在此所述预设差异范围的获取方式不做任何限定。

在本实施例中,借助所述差异范围作为判断是否在预设范围内的判断依据,无需计算出所述声源位置的具体位置信息,再根据声源位置的位置信息来所述音频信号的声源位置是否位于所述预设范围内,简化了终端的计算,提高了识别效率。

在一些实施例中,所述任意两个所述声音采集模组确定的预设差异范围,包括:位于所述预设范围内不同位置上的声源发出的同一声音到达所述任意两个所述声音采集模组所产生的声音参数差异所形成的差异范围。

需要理解的是,所述预设范围内任意一个位置上的声源发出的同一声音到达所述任意两个所述声音采集模组的声音参数之间会产生声音参数差异,这些声音参数差异实际上能够构成所述任意两个所述声音采集模组所确定的预设差异范围。

需要说明的是,针对同一预设范围,不同的两个所述声音采集模组所确定的预设差异范围不同。

在实际应用中,终端可以根据所述预设范围,确定对应的两个所述声音采集模组所确定的所述预设差异范围。

在一些实施例中,所述终端可以根据所述预设范围相对于终端的位置信息,将所述位置信息发送至服务器,从服务器获取对应的两个所述声音采集模组所确定的所述预设差异范围。

在另一些实施例中,所述终端存储有预设范围的位置信息与预设差异范围的对应关系,根据所述对应关系,确定对应的两个所述声音采集模组所确定的所述预设差异范围。

上述实施例中,无需终端计算预设范围对应的预设差异范围,提高了终端的处理速度,提升识别效率。

在另一些实施例中,为了提高所述预设差异范围的准确性,可以基于所述预设范围以及所述任意两个所述声音采集模组所采集的在所述预设范围内的同一声源的同一声音的声音参数差异,来实时确定出所述预设差异范围。

具体地,第一差异信息可以包含了所述任意两个所述声音采集模组之间的声音参数差异,第二差异信息也包含了所述任意两个所述声音采集模组之间的声音参数差异。这里,所述第一差异信息为位于预设范围的某一个边界点上声源发出的同一声音所形成的,所述第二差异信息可以为位于预设范围的另一个边界点上声源发出的同一声音所形成。

在本实施例中,由于是根据当前环境实时计算的所述任意两个所述声音采集模组所确定的所述预设差异范围,所得到的所述预设差异范围是即时性的,因此更能准确地基于这一预设差异范围表征所述预设范围,提高基于所述预设差异范围确定是否在预设范围的判断的准确性。

在一些实施例中,所述n为大于2的正整数时,为了提高判断的准确性,所述根据所述声音参数差异,确定采集到的所述音频信号的声源位置是否位于所述预设范围内,可以包括:

根据m组声音采集模组针对同一声源的同一声音的所述声音参数差异,确定采集到的所述音频信号的声源位置是否位于所述预设范围内;其中,m为大于或等于2且小于或等于的正整数,一组所述声音采集模组包括两个所述声音采集模组,不同组的所述声音采集模组之间至少一个所述声音采集模组不同。

这里,根据至少两组的声音采集模组对同一声源的同一声音的所述声音参数差异,相比只用一组声音采集模组对同一声源的同一声音的所述声音参数差异,来确定所述音频信号的声源位置是否位于所述预设范围内而言,提高了判断的准确性。

具体地,所述根据m组声音采集模组对同一声源的同一声音的所述声音参数差异,确定采集到的所述音频信号的声源位置是否位于所述预设范围内,包括:

根据m个组的所述声音采集模组对同一声源的同一声音的m个所述声音参数差异,分别确定是否落入对应组的所述声音采集模组的预设差异范围以获得m个结果,其中,m为小于或等于m且大于或等于1的正整数;根据m个所述结果,确定所述音频信号的声源位置是否位于所述预设范围内。

这里,所述根据m个所述结果,确定所述音频信号的声源位置是否位于所述预设范围内,可以包括:

根据m个所述结果,若m个所述结果中大于或等于预设比例的结果指示所述音频信号的声源位置位于所述预设范围内,则确定所述音频信号的声源位置位于所述预设范围内;若m个所述结果中小于预设比例的结果指示所述音频信号的声源位置位于所述预设范围内,则确定所述音频信号的声源位置未位于所述预设范围内。

这里,可以基于预设比例,将m个所述结果进行再次验证,提高所述声源位置是否位于所述预设范围内的判断准确性。

在另一些实施例中,根据m个所述结果,确定所述音频信号的声源位置是否位于所述预设范围内,还可以包括:

根据m个所述结果及所述结果对应的权值,确定所述音频信号的声源位置是否位于所述预设范围内。

其中,所述结果对应的权值可以理解为确定所述结果对应的声音采集模组组的对应权值。可以理解的是,在多组所述声音采集模组中,不同组所声音采集模组由于声音采集模组之间的距离差异等,会导致不同采集模组之间针对同一声源的同一声音的声音参数差异的准确性有所不同,因此,准确性越高的声音采集模组组则对应的权值,故,对应的结果的权值也就越高。

在本实施例中,根据m个所述结果,确定所述音频信号的声源位置是否位于所述预设范围内,相对于利用任意两个所述声音采集模组所确定的一个结果来确定所述音频信号的声源位置是否位于所述预设范围内而言,判断的准确性更高。

在一个具体的实施例中,所述声音参数以采集到的声音的时间为例,所述声音采集模组包括第一声音采集模组和第二采集模组。

所述根据声音参数,确定所述音频信号的声源位置是否位于预设范围内,包括:

根据同一声源的同一声音到达第一声音采集模组中的第一到达时刻,以及到达第二声音采集模组的第二到达时刻,确定出到达时间差;

判断所述到达时间差是否位于所述第一声音采集模组与所述第二声音采集模组对应的预设时间差范围内;

若位于,则确定所述音频信号的声源位置位于所述预设范围内;

若未位于,则确定所述音频信号的声源位置未位于所述预设范围内。

本实施例中,可以仅基于到达时间差,判断所述到达时间差是否在预设时间差范围内,来确定所述音频信号的声源位置是否位于所述预设范围。由于声音采集模组对时间的采集相对于响度和强度而言,误差率更低,因此,基于于到达时间差,判断所述到达时间差是否在预设时间差范围内,来确定所述音频信号的声源位置是否位于所述预设范围的准确性更高。

这里,所述预设时间范围也可以预先存储在终端中,在另一些实施例中,所述预设时间范围也可以由终端向服务器发送所述预设范围的位置信息,基于所述预设范围的位置信息接收到服务器反馈的所述预设时间差范围。

为了保证所述预设时间差范围的确定的准确性,所述方法还包括:

根据所述预设范围,确定所述预设范围的两个边界点;

确定位于第一边界点的第一声源发出的同一声音到达所述第一声音采集模组的第一时间信息,以及到达第二声音采集模组的第二时间信息;根据所述第一时间信息与所述第二时间信息,确定第一时间差;

确定位于第二边界点的第二声源发出的同一声音到达所述第一声音采集模组的第三时间信息,以及到达所述第二声音采集模组的第四时间信息;根据所述第三时间信息与所述第四时间信息,确定第二时间差;

根据所述第一时间差与所述第二时间差,确定出所述预设时间差范围。

可以理解的是,所述第一边界点离第一声音采集模组和第二声音采集模组的距离均不同,因此,位于所述第一边界点的第一声源发出的同一声音到达第一声音采集模组的第一时间信息,以及到达第二声音采集模组的第二时间信息,会形成第一时间差。同理,所述第二边界点离第一声音采集模组和第二声音采集模组的距离也均不同,因此,位于所述第二边界点的第二声源发出的同一声音到达第一声音采集模组,以及到达第二声音采集模组的第二时间信息,会形成第二时间差。

在本实施例中,由于是根据当前环境实时计算的第一声音采集模组和第二声音采集模组所确定的所述预设时间差范围,所得到的所述预设时间差范围是即时性的,因此更能准确地基于这一预设时间差范围表征所述预设范围,提高基于所述预设时间差范围确定是否在预设范围的判断的准确性。

进一步地,本公开提供了一个具体实施例,以进一步理解本公开实施例所提供的音频信号的处理方法。

请参阅图2,图2是根据一示例性实施例示出的一种音频信号的处理方法的场景示意图。在本实施例中,所述终端以手机20为例,所述手机包括两个麦克风,可以理解的是,两个所述麦克风相当于上述所述的任意两个所述声音采集模组。这里,两个所述麦克风包括:第一麦克风21和第二麦克风22。假设手机20平放在桌上。

在具体实施例一中,所述预设范围以距手机20的侧方预设距离为例,所述声音参数以采集到的声音的时间为例。

在本实施例中,首先,根据所述预设范围相对于所述终端的位置信息,确定所述预设范围的两个边界点。这里,两个所述边界点包括:第一边界点201和第二边界点202。

其次,以第一边界点201作为声源位置时,位于第一边界点201的第一声源发出的声音传播到第一麦克风21的时间为t1,位于第一边界点201的第一声源发出的声音传播到第二麦克风22的时间为t2,那么可以确定出第一时间差为t12,其中,t12等于t1减t2。这里,所述第一时间差可以理解为上述实施例所述的第一时间差。

同样地,以第二边界点202作为声源位置时,位于第二边界点202的第二声源发出的声音传播到第一麦克风21的时间为t3,位于第二边界点202的第二声源发出的声音传播到第二麦克风的时间t4,那么可以确定出第二时间差为t34,其中,所述t34等于t3减t4。这里,所述第二时间差可以理解为上述实施例所述的第二时间差。

需要说明的是,第一声源从第一边界点201分别传播同一声音到第一麦克风21的时间与传播到第二麦克风22的时间,可以根据所述第一边界点201分别到第一麦克风21与第二麦克风22的距离计算得到。

同样地,第二声源从第二边界点201分别传播到第一麦克风21的时间与传播到同一声音第二麦克风22的时间,可以根据所述第二边界点202分别到第一麦克风21与第二麦克风22的距离计算得到。

根据第一时间差t12与第二时间差t34,可以确定出第一麦克风与第二麦克风所确定的针对本实施例所述的预定距离对应的预设时间差范围。

最后,当手机采集到某个声源发出的声音,若该声音到达第一麦克风21和第二麦克风22的时间差在上述确定的所述预设时间差范围内,则确定该声音的声源位置在第一边界点201与第二边界点202所确定的预设范围内,也就是说该声音的声源位置在手机的侧方的预定距离。此时,终端识别该声音对应的音频信号。

相反,若该声音到达第一麦克风21和第二麦克风22的时间差在上述确定的所述预设时间差范围内,则确定该声音的声源位置不在第一边界点201与第二边界点202所确定的预设范围内,也就是说该声音的声源位置不在手机的侧方的预定距离。此时,系统不识别该声音对应的音频信号。

在具体实施例二中,所述预设范围以距离手机20上方的预设距离为例,所述声音参数以采集的声音的时间为例。

在本实施例中,首先,根据所述预设范围相对于所述终端的位置信息,确定所述预设范围的两个边界点。这里,两个边界点包括:第三边界点203和第四边界点204。

其次,以第三边界点203作为声源位置时,位于第三边界点203的第三声源发出的声音传播到第一麦克风21的时间为t5,位于第三边界点203的第三声源发出的声音传播到第二麦克风22的时间为t6,那么可以确定出以所述第三边界点203为所述声源位置的针对所述声音的第三时间差为t56,其中,t56等于t5减t6。实际上,这里所述第三时间差也可以理解为上述实施例所述第一时间差。

同样地,以第四边界点204作为声源位置时,位于第四边界点204的第四声源发出的声音传播到第一麦克风21的时间为t7,位于第四边界点204的第四声源发出的声音传播到第二麦克风的时间为t8,那么可以确定出以所述第四边界点204为所述声源位置的针对所述声音的第四时间差为t78,其中,所述t78等于t7减t8。实际上,这里所述第四时间差也可以理解为上述实施例所述的第二时间差。

需要说明的是,声源从第三边界点203分别传播同一声音到第一麦克风21的时间与传播到第二麦克风22的时间,可以根据所述第三边界点203分别到第一麦克风21与第二麦克风22的距离计算得到。

同样地,声源从第四边界点204分别传播同一声音到第一麦克风21的时间与传播到第二麦克风22的时间,可以根据所述第四边界点204分别到第一麦克风21与第二麦克风22的距离计算得到。

根据第三时间差t56与第二时间差t78,可以确定出第一麦克风与第二麦克风所确定的针对本实施例所述的预定距离对应的预设时间差范围。

最后,当手机采集到某个声源发出的声音,若该声音到达第一麦克风21和第二麦克风22的时间差在上述确定的所述预设时间差范围内,则确定该声音的声源位置在第三边界点203与第四边界点204所确定的预设范围内,也就是说该声音的声源位置在手机的上方的预定距离。此时,系统识别该声音对应的音频信号。

相反,若该声音到达第一麦克风21和第二麦克风22的时间差不在上述确定的所述预设时间差范围内,则确定该声音的声源位置不在第三边界点203与第四边界点204所确定的预设范围内,也就是说该声音的声源位置不在手机上方的预定距离。此时,系统不识别该声音对应的音频信号。

上述实施例,可以实现识别终端的指定位置范围内的声音,避免识别终端全方位的声音问题,从而可以有针对性的进行语音识别,提升用户体验。

图3是根据一示例性实施例示出的一种音频信号的处理装置的框图。参照图3,该装置包括采集模块31、第一确定模块32及识别模块33;其中,

所述采集模块31,被配置为通过声音采集模组采集音频信号;

所述第一确定模块32,被配置为根据声音参数,确定采集到的所述音频信号的声源位置是否位于预设范围内;

识别模块33,被配置为当所述声源位置位于所述预设范围内时,识别所述音频信号。

在一可选的实施例中,所述第一确定模块32,还被配置为:

根据n中任意两个所述声音采集模组采集到的同一声源的同一声音的声音参数,确定声音参数差异,其中,n为大于或等于2的正整数;

若所述声音参数差异位于所述任意两个所述声音采集模组所确定的预设差异范围内,则确定所述音频信号的声源位置位于所述预设范围内;

若所述声音参数差异未位于所述任意两个所述声音采集模组所确定的预设差异范围内,则确定所述音频信号的声源位置未位于所述预设范围内。

在一可选的实施例中,所述任意两个所述声音采集模组确定的预设差异范围,包括:位于所述预设范围内不同位置上的声源发出的同一声音到达所述任意两个所述声音采集模组所产生的声音参数差异所形成的差异范围。

在一可选的实施例中,所述n为大于2的正整数时,

所述第一确定模块32,还被配置为:

根据m组声音采集模组针对同一声源的同一声音的所述声音参数差异,确定采集到的所述音频信号的声源位置是否位于所述预设范围内;其中,m为大于或等于2且小于或等于的正整数,一组所述声音采集模组包括两个所述声音采集模组,不同组的所述声音采集模组之间至少一个所述声音采集模组不同。

在一些实施例中,所述第一确定模组32,还被具体配置为:

根据m个组的所述声音采集模组针对同一声源的同一声音的m个所述声音参数差异,分别确定是否落入对应组的所述声音采集模组的预设差异范围内以获得m个结果,其中,m为小于或等于m且大于或等于1的正整数;

根据m个所述结果,确定所述音频信号的声源位置是否位于所述预设范围内。

在一可选的实施例中,所述第一确定模块32,还被具体配置为:

根据同一声源的同一声音到达第一声音采集模组的第一到达时刻,以及到达第二声音采集模组的第二到达时刻,确定出到达时间差;

判断所述到达时间差是否位于第一声音采集模组与所述第二声音采集模组对应的预设时间差范围内;

若位于,则确定所述音频信号的声源位置位于所述预设范围内;

若未位于,则确定所述音频信号的声源位置未位于所述预设范围内

在一些实施例中,所述装置还包括:第二确定模块,其中,所述第二确定模块包括:

第一确定子模块,被配置为根据所述预设范围,确定所述预设范围的两个边界点;

第二确定子模块,被配置为确定位于第一边界点的第一声源发出的同一声音到达所述第一声音采集模组的第一时间信息;以及到达所述第二声音采集模组的第二时间信息;根据所述第一时间信息与所述第二时间信息,确定第一时间差;

第三确定子模块,被配置为确定位于第二边界点的第二声源发出的同一声音到达所述第一声音采集模组的第三时间信息,以及到达所述第二声音采集模组的第四时间信息;根据所述第三时间信息与所述第四时间信息,确定第二时间差;

第四确定子模块,被配置为根据所述第一时间差与所述第二时间差,确定出所述预设时间差范围。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图4是根据一示例性实施例示出的一种用于终端400的框图。例如,终端400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图4,终端400可以包括以下一个或多个组件:处理组件402,存储器404,电力组件406,多媒体组件404,音频组件410,输入/输出(i/o)的接口412,传感器组件414,以及通信组件416。

处理组件402通常控制终端400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理组件402可以包括多媒体模块,以方便多媒体组件408和处理组件402之间的交互。

存储器404被配置为存储各种类型的数据以支持在终端400的操作。这些数据的示例包括用于在终端400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。

电力组件406为终端400的各种组件提供电力。电力组件406可以包括电源管理系统,一个或多个电源,及其他与为终端400生成、管理和分配电力相关联的组件。

多媒体组件404包括在所述终端400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件404包括一个前置摄像头和/或后置摄像头。当终端400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(mic),当终端400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。

i/o接口412为处理组件402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件414包括一个或多个传感器,用于为终端400提供各个方面的状态评估。例如,传感器组件414可以检测到终端400的打开/关闭状态,组件的相对定位,例如所述组件为终端400的显示器和小键盘,传感器组件414还可以检测终端400或终端400一个组件的位置改变,用户与终端400接触的存在或不存在,终端400方位或加速/减速和终端400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件416被配置为便于终端400和其他终端之间有线或无线方式的通信。终端400可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件416还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。

在示例性实施例中,终端400可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由终端400的处理器420执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质,当所述存储介质中的指令由终端的处理器执行时,使得终端能够执行上述各实施例所述的音频信号的处理方法。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips