HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

一种语音分割点的确定方法和装置与流程

2021-01-28 15:01:19|312|起点商标网
一种语音分割点的确定方法和装置与流程

本发明涉及语音信号处理技术领域,尤其涉及一种语音分割点的确定方法和装置。



背景技术:

随着语音交互技术的兴起,以及语音交互技术在产业中的广泛应用,从语音中提取多维度的信息用于交互,比如提取说话人身份信息、性别信息、情感信息等,对改进交互产品的体验越来越重要。其中,说话人身份识别对实现个性化交互服务尤为重要。

现有实时说话人识别技术,基于实时语音活动检测(voiceactivitydetection,vad)根据语音端点切分语音,馈送给说话人识别模块。其问题在于,对于实时语音信号,vad的分割点与不同说话人的分割点并不一致,这种切分方法,往往使得一个vad分割片段内包含多个说话人语音,将这个分割片段馈送给说话人识别模块,说话人识别不准。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种语音分割点的确定方法和装置。

依据本发明的第一方面,提供了一种语音分割点的确定方法,该方法包括:

获取关于当前帧的第一时间范围内的语音帧发生特征变化的第一分割点;

对所述第一时间范围内的语音帧,从所述第一分割点开始按照第一预设帧长度进行分段,获取分段之后的第一子段落,并提取每一所述第一子段落的嵌入矢量,直至再次获取到所述语音帧发生特征变化的第二分割点;

在相邻两个所述第一子段落的嵌入矢量的相似度满足预设条件的情况下,确定所述当前帧的时间为第一目标分割点。

可选的,所述在相邻两个所述第一子段落的嵌入矢量的相似度满足预设条件的情况下,确定所述当前帧的时间为第一目标分割点,包括:

获取相邻两个第一子段落的嵌入矢量的相似度;

将所述相似度与预设阈值进行比较,若所述相似度小于所述预设阈值,则确定所述当前帧的时间为所述第一目标分割点。

可选的,所述相似度为相邻两个第一子段落的嵌入矢量的余弦距离或者欧式距离;

其中,相邻两个第一子段落的嵌入矢量在空间中距离越近,相似度越大。

可选的,在所述确定所述当前帧的时间为第一目标分割点之后,所述方法还包括:

获取与所述第一目标分割点相邻的第二目标分割点;

将所述第一目标分割点与所述第二目标分割点之间的语音帧,按照第二预设帧长度进行分段,获取分段之后的第二子段落,并提取每一所述第二子段落的嵌入矢量;

根据所述第二子段落的嵌入矢量,确定多个对象中的目标对象。

可选的,所述根据所述第二子段落的嵌入矢量,确定多个对象中的目标对象,包括:

在所述第二子段落的嵌入矢量为多个的情况下,计算多个所述第二子段落的嵌入矢量的嵌入矢量平均值;

根据所述嵌入矢量平均值与对象之间的对应关系,确定多个对象中与所述嵌入矢量平均值对应的对象为所述目标对象。

依据本发明的第二方面,提供了一种语音分割点的确定装置,该装置包括:

第一获取模块,用于获取关于当前帧的第一时间范围内的语音帧发生特征变化的第一分割点;

第一处理模块,用于对所述第一时间范围内的语音帧,从所述第一分割点开始按照第一预设帧长度进行分段,获取分段之后的第一子段落,并提取每一所述第一子段落的嵌入矢量,直至再次获取到所述语音帧发生特征变化的第二分割点;

第二处理模块,用于在相邻两个所述第一子段落的嵌入矢量的相似度满足预设条件的情况下,确定所述当前帧的时间为第一目标分割点。

可选的,所述第二处理模块,包括:

第二获取单元,用于获取相邻两个第一子段落的嵌入矢量的相似度;

第二处理单元,用于将所述相似度与预设阈值进行比较,若所述相似度小于所述预设阈值,则确定所述当前帧的时间为所述第一目标分割点。

可选的,所述相似度为相邻两个第一子段落的嵌入矢量的余弦距离或者欧式距离;

其中,相邻两个第一子段落的嵌入矢量在空间中距离越近,相似度越大。

可选的,所述装置还包括:

第二获取模块,用于获取与所述第一目标分割点相邻的第二目标分割点;

第三处理模块,用于将所述第一目标分割点与所述第二目标分割点之间的语音帧,按照第二预设帧长度进行分段,获取分段之后的第二子段落,并提取每一所述第二子段落的嵌入矢量;

第一确定模块,用于根据所述第二子段落的嵌入矢量,确定多个对象中的目标对象。

可选的,所述第一确定模块,包括:

第一计算单元,用于在所述第二子段落的嵌入矢量为多个的情况下,计算多个所述第二子段落的嵌入矢量的嵌入矢量平均值;

第一确定单元,用于根据所述嵌入矢量平均值与对象之间的对应关系,确定多个对象中与所述嵌入矢量平均值对应的对象为所述目标对象。

本发明实施例提供的一种语音分割点的确定方法和装置,通过获取关于当前帧的第一时间范围内的语音帧发生特征变化的第一分割点,对所述第一时间范围内的语音帧,从所述第一分割点开始按照第一预设帧长度进行分段,获取分段之后的第一子段落,并提取每一所述第一子段落的嵌入矢量,直至再次获取到所述语音帧发生特征变化的第二分割点,在相邻两个所述第一子段落的嵌入矢量的相似度满足预设条件的情况下,确定所述当前帧的时间为第一目标分割点,通过第一目标分割点可以对实时语音进行准确的分割,以便可以精准识别说话人。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。

图1为本发明实施例提供的语音分割点的确定方法的流程示意图;

图2为本发明实施例提供的语音分割点的确定装置的框图;

图3为本发明实施例提供的电子设备的框图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解的是,还可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。

目前,在多人说话场景下,实时进行说话人识别的根本性困难在于,难以实时将不同人的语音在时域切分开,送给说话人识别模块的语音可能是包含多个说话人的声音,导致说话人识别判决失误。

因此,本发明实施例提供了一种语音分割点的确定方法和装置,能够将时间域的语音信号按不同人进行准确的分割,以便可以精准识别说话人。

如图1所示,本发明实施例提供了一种语音分割点的确定方法,所述方法具体可以包括:

步骤101,获取关于当前帧的第一时间范围内的语音帧发生特征变化的第一分割点。

具体的,获取第一语音信息,并按照所述第一时间窗口计算所述第一语音信息的梅尔倒谱系数(mel-scalefrequencycepstralcoefficients,mfcc)特征或滤波器组(filterbank,fbank)特征等。

需要说明的是,所述第一语音信息为一段实时语音或一段已存储的语音等。

假设,当前帧的时间指标为t,利用贝叶斯信息(bayesianinformationcriterion,bic)准则,将所述第一时间范围内的语音帧进行切分,获取发生特征变化的第一分割点,可以记作tk-1并作为初步分割点进行保存。所述第一时间范围可以为:[t-p,t-q],其中,p和q均为常数,可以根据需要进行设定。

需要说明的是,p可以为历史语音帧的长度,q可以为未来语音帧的长度(即以后可能会产生的语音的语音帧的长度)。

步骤102,对所述第一时间范围内的语音帧,从所述第一分割点开始按照第一预设帧长度进行分段,获取分段之后的第一子段落,并提取每一所述第一子段落的嵌入矢量,直至再次获取到所述语音帧发生特征变化的第二分割点。

具体的,在步骤102中,从tk-1帧开始可以按照第一预设帧长度(如:窗口长度win_seg)实时切分第一子段落:segi,可以切分为k个第一子段落:seg1,seg1,……,segk,并对每一个第一子段落segi提取嵌入矢量(可以记作e-vector)得到第一子段落的嵌入矢量vi,一直到获取到下一个bic分割点tk(即第二分割点)结束切分。其中,k和i均为大于或等于1的正整数,且k大于或等于i。所述第二分割点与所述第一分割点之间的语音帧记作一个bic分割段bic_seg。其中,所述第一预设帧长度为设定的需要切分的第一子段落的语音帧长度数值,可以根据需要进行设定。

需要说明的是,上述第一子分段相当于是将所述第一分割点和所述第二分割点之间的语音帧按照所述第一预设帧长度分割的子段落。从所述第一分割点开始按照第一预设帧长度分割第一子段落的过程中,如果最后一个第一子段落与所述第二分割点之间的语音帧长度小于第一子段落,则所述第一分割点和所述第二分割点之间的语音帧即切分为一个或多个完整的具有第一预设帧长度的第一子段落和一个小于第一预设帧长度的第一子段落。

例如:如果第一分割点为1000帧,第二分割点为1100帧,则所述第一分割点和所述第二分割点之间的语音帧为100帧,换句话说,所述bic分割段bic_seg为100帧。如果第一预设帧长度为20帧,则所述第一子段落的数量为5个,即1000帧至1020帧为一个第一子段落,1020帧至1040帧为一个第一子段落,1040帧至1060帧为一个第一子段落,1060帧至1080帧为一个第一子段落,1080帧至1100帧为一个第一子段落。每一个第一子段落均具有20帧长度。

例如:如果第一分割点为1000帧,第二分割点为1100帧,则所述第一分割点和所述第二分割点之间的语音帧为100帧,换句话说,所述bic分割段bic_seg为100帧。如果第一预设帧长度为30帧,则所述第一子段落的数量为4个,即1000帧至1030帧为一个第一子段落,1030帧至1060帧为一个第一子段落,1060帧至1090帧为一个第一子段落,1090帧至1100帧为一个第一子段落。前面三个第一子段落均为30帧长度,最后一个第一子段落具有10帧长度。

需要说明的是,所述嵌入矢量为基于长短期记忆网络(longshort-termmemory,lstm)的嵌入矢量dvector,或者基于时间延迟神经网络(time-delayneuralnetwork,tdnn)的嵌入矢量xvector,或者基于其他构型的神经网络提取的说话人嵌入矢量等,在此不做具体限定。其中,dvector和xvector均为多种嵌入矢量的其中一种。

需要说明的是,也可以先获取第二分割点,然后通过查询保存的第一分割点得到bic分割段bic_seg,然后再将所述第一分割点和所述第二分割点之间的语音帧按照所述第一预设帧长度分割为第一子段落。获取第一子段落以及第一子段落的嵌入矢量的步骤和获取第二分割点的步骤可以有先后关系,也可以同步进行,上述过程和顺序并不限定。

步骤103,在相邻两个所述第一子段落的嵌入矢量的相似度预设条件的情况下,确定所述当前帧的时间为第一目标分割点。

具体的,如果bic分割段bic_seg中的相邻两个所述第一子段落的嵌入矢量的相似度满足预设条件,则可以确定所述当前帧的时间为第一目标分割点,即所述第一语音信息可以按照第一目标分割点进行语音分割。如果相邻两个所述第一子段落的嵌入矢量的相似度不满足预设条件,则不会从当前帧的时间对所述第一语音信息进行分割。

需要说明的是,所述预设条件为判定所述当前帧的时间是否可以作为第一目标分割点的条件。

本发明上述实施例中,通过获取关于当前帧的第一时间范围内的语音帧发生特征变化的第一分割点,对所述第一时间范围内的语音帧,从所述第一分割点开始按照第一预设帧长度进行分段,获取分段之后的第一子段落,并提取每一所述第一子段落的嵌入矢量,直至再次获取到所述语音帧发生特征变化的第二分割点,在相邻两个所述第一子段落的嵌入矢量的相似度满足预设条件的情况下,确定所述当前帧的时间为第一目标分割点,通过第一目标分割点可以对实时语音进行准确的分割,以便可以精准识别说话人。

可选的,所述步骤103,具体可以包括:

获取相邻两个第一子段落的嵌入矢量的相似度;

将所述相似度与预设阈值进行比较,若所述相似度小于所述预设阈值,则确定所述当前帧的时间为所述第一目标分割点。

具体的,计算前后两个(即相邻两个)第一子段落e-vector(vt-1,vt-1)的相似度sim(vt-1,vt-1),换句话说,计算相邻两个第一子段落分别提取的嵌入矢量的相似度,可以记作st。然后将所述相似度与所述预设阈值(记作thr)进行比较,若所述相似度小于所述预设阈值,则可以将所述当前帧的时间t作为说话人转换的第j个分割点:

scj=t

并将第j个分割点进行保存,其中,j为大于或等于1的正整数。

可选的,所述相似度为相邻两个第一子段落的嵌入矢量的余弦距离或者欧式距离;

其中,相邻两个第一子段落的嵌入矢量在空间中距离越近,相似度越大。

具体的,如果所述相似度为相邻两个第一子段落的嵌入矢量的余弦距离,则所述余弦距离越大越可能是同一个人,欧式距离越小越可能是同一个人;换句话说,相似度是衡量两个人的声音特征的距离,距离越近是同一个人的可能越大。

可选的,在所述步骤103之后,所述方法还可以包括:

获取与所述第一目标分割点相邻的第二目标分割点;

将所述第一目标分割点与所述第二目标分割点之间的语音帧,按照第二预设帧长度进行分段,获取分段之后的第二子段落,并提取每一所述第二子段落的嵌入矢量;

根据所述第二子段落的嵌入矢量,确定多个对象中的目标对象。

具体的,在确定所述当前帧的时间为所述第一目标分割点之后,可以查询保存的上一个说话人分割点scj-1,即与所述第一目标分割点相邻的第二目标分割点;将所述第一目标分割点scj与所述第二目标分割点scj-1之间的语音帧按照所述第二预设帧长度进行切分,获取切分之后的第二子段落,并提取每一个所述第二子段落的嵌入矢量。换句话说,从所述第一目标分割点开始按照所述第二预设帧长度切分第二子段落,一直切分至所述第二目标分割点。然后根据每一个所述第二子段落的嵌入矢量,可以识别并确定多个对象中的目标对象,即可以对说话人进行识别,提高识别效率和准确率。其中,所述第二预设帧长度为设定的需要切分的第二子段落的语音帧长度数值,可以根据需要进行设定。

需要说明的是,所述第一预设帧长度与所述第二预设帧长度可以为相同的帧长度,也可以为不同的帧长度,且所述第一子段落的长度和所述第二子段落的长度可以为相同的长度,也可以为不同的长度,在此不做具体限定。

可选的,上述所述根据所述第二子段落的嵌入矢量,确定多个对象中的目标对象的步骤,具体可以包括:

在所述第二子段落的嵌入矢量为多个的情况下,计算多个所述第二子段落的嵌入矢量的嵌入矢量平均值;

根据所述嵌入矢量平均值与对象之间的对应关系,确定多个对象中与所述嵌入矢量平均值对应的对象为所述目标对象。

具体的,注册声纹库中有多个对象,每一个对象均有对应的嵌入矢量声纹模型。如果所述第二子段落为一个,则所述第二子段落的嵌入矢量的数量为1个,则可以将所述第二子段落的嵌入矢量与注册声纹库中对象的嵌入矢量声纹模型进行比较,判断所述第二子段落的嵌入矢量是否属于注册声纹库中某个对象(即说话人),如果是,则进一步可以根据所述第二子段落的嵌入矢量与注册声纹库中对象的嵌入矢量声纹模型之间的对应关系,确定多个对象中与所述第二子段落的嵌入矢量对应的对象为所述目标对象,即可以识别出说话人的身份。

如果所述第二子段落为多个,则所述第二子段落的嵌入矢量的数量为多个,则首先计算多个所述第二子段落的嵌入矢量的嵌入矢量平均值meanj,然后可以将所述嵌入矢量平均值meanj与注册声纹库中对象的嵌入矢量声纹模型进行比较,判断所述嵌入矢量平均值meanj是否属于注册声纹库中某个对象(即说话人),如果是,则进一步可以根据所述嵌入矢量平均值meanj与注册声纹库中对象的嵌入矢量声纹模型之间的对应关系,确定多个对象中与所述嵌入矢量平均值meanj对应的对象为所述目标对象,即可以识别出说话人的身份。

需要说明的是,提取的所述第一子段落的嵌入矢量、提取的所述第二子段落中的嵌入矢量以及注册声纹库中的说话人的嵌入矢量声纹模型需要是同一种构型的神经网络提取的说话人嵌入矢量,换句话说,用于分割的e-vector方法与用于说话人识别的e-vector方法是同一套方法,一次提取的e-vector既可用于说话人分割,又可用于说话人识别,提高了系统实时性效率。例如:如果提取的所述第一子段落的嵌入矢量为dvector,则提取的所述第二子段落中的嵌入矢量以及注册声纹库中的说话人的嵌入矢量声纹模型也需要是dvector,可以提高系统实时性效率。

综上所述,本发明实施例中,经过bic初次分割得到第一分割点以及第二分割点,经过e-vector二次分割得到第一目标分割点,通过第一目标分割点能准确的找到说话人分割点;其次,用于分割的e-vector方法与用于说话人识别的e-vector方法是同一套方法,一次提取的e-vector既可用于说话人分割,又可用于说话人识别,提高了系统实时性效率。

如图2所示,本发明实施例提供了一种语音分割点的确定装置,所述语音分割点的确定装置200包括:

第一获取模块201,用于获取关于当前帧的第一时间范围内的语音帧发生特征变化的第一分割点;

第一处理模块202,用于对所述第一时间范围内的语音帧,从所述第一分割点开始按照第一预设帧长度进行分段,获取分段之后的第一子段落,并提取每一所述第一子段落的嵌入矢量,直至再次获取到所述语音帧发生特征变化的第二分割点;

第二处理模块203,用于在相邻两个所述第一子段落的嵌入矢量的相似度满足预设条件的情况下,确定所述当前帧的时间为第一目标分割点。

本发明上述实施例中,第一获取模块201获取关于当前帧的第一时间范围内的语音帧发生特征变化的第一分割点,第一处理模块202对所述第一时间范围内的语音帧,从所述第一分割点开始按照第一预设帧长度进行分段,获取分段之后的第一子段落,并提取每一所述第一子段落的嵌入矢量,直至再次获取到所述语音帧发生特征变化的第二分割点,第二处理模块203在相邻两个所述第一子段落的嵌入矢量的相似度满足预设条件的情况下,确定所述当前帧的时间为第一目标分割点,通过第一目标分割点可以对实时语音进行准确的分割,以便可以精准识别说话人。

可选的,所述第二处理模块203,包括:

第二获取单元,用于获取相邻两个第一子段落的嵌入矢量的相似度;

第二处理单元,用于将所述相似度与预设阈值进行比较,若所述相似度小于所述预设阈值,则确定所述当前帧的时间为所述第一目标分割点。

可选的,所述相似度为相邻两个第一子段落的嵌入矢量的余弦距离或者欧式距离;

其中,相邻两个第一子段落的嵌入矢量在空间中距离越近,相似度越大。

可选的,所述装置还包括:

第二获取模块,用于获取与所述第一目标分割点相邻的第二目标分割点;

第三处理模块,用于将所述第一目标分割点与所述第二目标分割点之间的语音帧,按照第二预设帧长度进行分段,获取分段之后的第二子段落,并提取每一所述第二子段落的嵌入矢量;

第一确定模块,用于根据所述第二子段落的嵌入矢量,确定多个对象中的目标对象。

可选的,所述第一确定模块,包括:

第一计算单元,用于在所述第二子段落的嵌入矢量为多个的情况下,计算多个所述第二子段落的嵌入矢量的嵌入矢量平均值;

第一确定单元,用于根据所述嵌入矢量平均值与对象之间的对应关系,确定多个对象中与所述嵌入矢量平均值对应的对象为所述目标对象。

综上所述,本发明实施例中,经过bic初次分割得到第一分割点以及第二分割点,经过e-vector二次分割得到第一目标分割点,通过第一目标分割点能准确的找到说话人分割点;其次,用于分割的e-vector方法与用于说话人识别的e-vector方法是同一套方法,一次提取的e-vector既可用于说话人分割,又可用于说话人识别,提高了系统实时性效率。

需要说明的是,该语音分割点的确定装置实施例是与上述语音分割点的确定方法相对应的装置,上述方法实施例的所有实现方式均适用于该装置实施例中,也能达到与其相同的技术效果,在此不再赘述。

本发明实施例还提供了一种电子设备,如图3所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。

存储器303,用于存放计算机程序。

在电子设备为终端设备时,所述处理器301用于执行存储器303上所存放的程序时,实现如下步骤:

获取关于当前帧的第一时间范围内的语音帧发生特征变化的第一分割点;

对所述第一时间范围内的语音帧,从所述第一分割点开始按照第一预设帧长度进行分段,获取分段之后的第一子段落,并提取每一所述第一子段落的嵌入矢量,直至再次获取到所述语音帧发生特征变化的第二分割点;

在相邻两个所述第一子段落的嵌入矢量的相似度与所述预设阈值满足预设条件的情况下,确定所述当前帧的时间为第一目标分割点。

可选的,所述在相邻两个所述第一子段落的嵌入矢量的相似度满足预设条件的情况下,确定所述当前帧的时间为第一目标分割点,包括:

获取相邻两个第一子段落的嵌入矢量的相似度;

将所述相似度与预设阈值进行比较,若所述相似度小于所述预设阈值,则确定所述当前帧的时间为所述第一目标分割点。

可选的,所述相似度为相邻两个第一子段落的嵌入矢量的余弦距离或者欧式距离;

其中,相邻两个第一子段落的嵌入矢量在空间中距离越近,相似度越大。

可选的,在所述确定所述当前帧的时间为第一目标分割点之后,所述处理器301用于执行存储器303上所存放的程序时,还实现如下步骤:

获取与所述第一目标分割点相邻的第二目标分割点;

将所述第一目标分割点与所述第二目标分割点之间的语音帧,按照第二预设帧长度进行分段,获取分段之后的第二子段落,并提取每一所述第二子段落的嵌入矢量;

根据所述第二子段落的嵌入矢量,确定多个对象中的目标对象。

可选的,所述根据所述第二子段落的嵌入矢量,确定多个对象中的目标对象,包括:

在所述第二子段落的嵌入矢量为多个的情况下,计算多个所述第二子段落的嵌入矢量的嵌入矢量平均值;

根据所述嵌入矢量平均值与对象之间的对应关系,确定多个对象中与所述嵌入矢量平均值对应的对象为所述目标对象。

上述电子设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(randomaccessmemory,简称ram),也可以包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现场可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中所述的语音分割点的确定方法。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本领域技术人员易于想到的是:上述各个实施例的任意组合应用都是可行的,故上述各个实施例之间的任意组合都是本发明的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

相关标签: 特征提取矢量
tips