HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

语谱图匹配方法、装置、设备及计算机可读存储介质与流程

2021-01-28 18:01:15|293|起点商标网
语谱图匹配方法、装置、设备及计算机可读存储介质与流程

本发明涉及语音处理技术领域,尤其涉及一种语谱图匹配方法、装置、设备及计算机可读存储介质。



背景技术:

目前,随着社会的不断发展,语音处理技术也逐渐应用到各个领域,而语谱图是一种常用的语音数据表现方式,语音处理的过程中常常需要使用到语谱图,并通过语谱图之间的匹配进行语音识别、身份识别等处理。

传统的语谱图匹配方法是由人通过肉眼的方式进行差异比对,从而判断语谱图之间的匹配情况,但这种匹配方法容易因为人的差异而得出不同的结论,从而影响了判断的准确性。



技术实现要素:

本发明的主要目的在于提供一种语谱图匹配方法、装置、设备及计算机可读存储介质,旨在解决人工比对语谱图的方法准确性低的技术问题。

为实现上述目的,本发明实施例提供一种语谱图匹配方法,所述语谱图匹配方法包括:

获取检体语谱图,并获取样本语谱图;

在接收到基于所述检体语谱图的音素选择指令时,在所述检体语谱图中确定对应的检体音素点,并在所述样本语谱图中确定与所述检体音素点对应的样本音素点;

获取所述检体音素点的检体音素属性,并获取所述样本音素点的样本音素属性;

根据所述检体音素属性和所述样本音素属性,计算所述检体音素点和所述样本音素点的音素相似度,并根据所述音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度。

可选地,所述获取检体语谱图的步骤包括:

获取检体音频,并基于预设规则将所述检体音频转化为检体语谱图。

可选地,所述根据所述检体音素属性和所述样本音素属性,计算所述检体音素点和所述样本音素点的音素相似度的步骤包括:

将所述检体音素属性转换为对应的检体音素向量,并将所述样本音素属性转换为对应的样本音素向量;

计算所述检体音素向量和所述样本音素向量的向量相似度,根据所述向量相似度确定所述音素相似度。

可选地,所述样本语谱图中同一检体音素点对应的检体音素点数量为两个以上,

所述根据所述检体音素属性和所述样本音素属性,计算所述检体音素点和所述样本音素点的音素相似度,并根据所述音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度的步骤包括:

根据所述检体音素属性和所述样本音素属性,分别计算所述检体音素点与各样本音素点之间的音素相似度;

根据各音素相似度获取第一综合音素相似度,并根据所述第一综合音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度。

可选地,所述检体音素点的数量为两个以上,

所述根据所述检体音素属性和所述样本音素属性,计算所述检体音素点和所述样本音素点的音素相似度,并根据所述音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度的步骤包括:

根据所述检体音素属性和所述样本音素属性,分别计算各检体音素点与对应样本音素点之间的音素相似度;

根据各音素相似度获取第二综合音素相似度,并根据所述第二综合音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度。

可选地,所述根据所述检体音素属性和所述样本音素属性,计算所述检体音素点和所述样本音素点的音素相似度,并根据所述音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度的步骤之后,还包括:

显示所述检体音素属性、所述样本音素属性、所述音素相似度和所述语谱图匹配度。

可选地,所述根据所述检体音素属性和所述样本音素属性,计算所述检体音素点和所述样本音素点的音素相似度,并根据所述音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度的步骤之后,还包括:

判断所述语谱图匹配度是否大于预设阈值;

若所述语谱图匹配度大于预设阈值,则获取所述样本语谱图对应的样本身份信息,并根据所述样本身份信息确定所述检体语谱图的检体身份信息。

此外,为实现上述目的,本发明实施例还提供一种语谱图匹配装置,所述语谱图匹配装置包括:

语谱图获取模块,用于获取检体语谱图,并获取样本语谱图;

音素点获取模块,用于在接收到基于所述检体语谱图的音素选择指令时,在所述检体语谱图中确定对应的检体音素点,并在所述样本语谱图中确定与所述检体音素点对应的样本音素点;

属性获取模块,用于获取所述检体音素点的检体音素属性,并获取所述样本音素点的样本音素属性;

匹配度确定模块,用于根据所述检体音素属性和所述样本音素属性,计算所述检体音素点和所述样本音素点的音素相似度,并根据所述音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度。

此外,为实现上述目的,本发明实施例还提供一种语谱图匹配设备,所述语谱图匹配设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的语谱图匹配程序,其中所述语谱图匹配程序被所述处理器执行时,实现如上述的语谱图匹配方法的步骤。

此外,为实现上述目的,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有语谱图匹配程序,其中所述语谱图匹配程序被处理器执行时,实现如上述的语谱图匹配方法的步骤。

本发明提供一种语谱图匹配方法、装置、设备及计算机可读存储介质,通过获取检体语谱图,并获取样本语谱图;在接收到基于所述检体语谱图的音素选择指令时,在所述检体语谱图中确定对应的检体音素点,并在所述样本语谱图中确定与所述检体音素点对应的样本音素点;获取所述检体音素点的检体音素属性,并获取所述样本音素点的样本音素属性;根据所述检体音素属性和所述样本音素属性,计算所述检体音素点和所述样本音素点的音素相似度,并根据所述音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度。通过上述方式,本发明根据接收到音素选择指令在所述检体语谱图中确定对应的检体音素点,同时在样本语谱图中确定与检体音素点对应的样本音素点,然后根据互相对应的音素点各自的音素属性计算音素点之间的音素相似度,并通过对应音素点之间的音素相似来确定语谱图匹配度,从而从音素属性出发,根据同一音素在不同语谱图的音素属性关系对语谱图之间的匹配关系进行量化描述,有利于提高语谱图匹配判断的准确性。

附图说明

图1为本发明实施例方案中涉及的语谱图匹配设备的硬件结构示意图;

图2为本发明语谱图匹配方法第一实施例的流程示意图;

图3为本发明语谱图匹配装置第一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例涉及的语谱图匹配方法主要应用于语谱图匹配设备,该语谱图匹配设备可以是个人计算机(personalcomputer,pc)、笔记本电脑、移动终端等具有数据处理功能的设备。

参照图1,图1为本发明实施例方案中涉及的语谱图匹配设备的硬件结构示意图。本发明实施例中,该语谱图匹配设备可以包括处理器1001(例如中央处理器centralprocessingunit,cpu),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真wireless-fidelity,wi-fi接口);存储器1005可以是高速随机存取存储器(randomaccessmemory,ram),也可以是稳定的存储器(non-volatilememory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的硬件结构并不构成对本发明的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

继续参照图1,图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及语谱图匹配程序。在图1中,网络通信模块可用于连接预设数据库,与数据库进行数据通信;而处理器1001可以调用存储器1005中存储的语谱图匹配程序,并执行本发明实施例提供的语谱图匹配方法。

基于上述的硬件架构,提出本发明语谱图匹配方法的各实施例。

本发明实施例提供了一种语谱图匹配方法。

参照图2,图2为本发明语谱图匹配方法第一实施例的流程示意图。

本实施例中,所述语谱图匹配方法包括以下步骤:

步骤s10,获取检体语谱图,并获取样本语谱图;

语谱图是一种常用的语音数据表现方式,语音处理的过程中常常需要使用到语谱图,并通过语谱图之间的匹配进行语音识别、身份识别等处理。在语谱图中,x轴表示时间,y轴表示频率,坐标点值为语音数据能量;由于是采用二维平面表达三维信息,所以能量值的大小是通过颜色来表示的,颜色深,表示该点的语音能量越强。传统的语谱图匹配方法是由人通过肉眼的方式进行差异比对,从而判断语谱图之间的匹配情况,但这种匹配方法容易因为人的差异而得出不同的结论,从而影响了判断的准确性。对此,本实施例中提出一种语谱图匹配方法,根据接收到音素选择指令在所述检体语谱图中确定对应的检体音素点,同时在样本语谱图中确定与检体音素点对应的样本音素点,然后根据互相对应的音素点各自的音素属性计算音素点之间的音素相似度,并通过对应音素点之间的音素相似来确定语谱图匹配度,从而从音素属性出发,根据同一音素在不同语谱图的音素属性关系对语谱图之间的匹配关系进行量化描述,有利于提高语谱图匹配判断的准确性。

本实施例中的语谱图匹配方法是由语谱图匹配设备实现的,该语谱图匹配设备可以是个人计算机、笔记本电脑、移动终端(如手机)等设备,本实施例中计算机为例进行说明。本实施例中,计算机首先将要获取检体语谱图,该检体语谱图可认为是当前需要处理的目标对象。其次,计算机的数据库中预先存储有若干样本语谱图,该样本语谱图可认为是之前预先收集好的,当匹配过程开始时将会从数据库中获取样本语谱图,并就检体语谱图和样本语谱图执行后续匹配处理。

进一步地,步骤“获取检体语谱图”包括:

获取检体音频,并基于预设规则将所述检体音频转化为检体语谱图。

值得说明的是,本实施例中计算机在初始阶段仅获取到了检体音频,为了进行后续的匹配处理,计算机在得到检体音频时需要基于一定的预设规则对检体音频进行对应的转化处理,以得到对应的检体语谱图。其中在转化时,可以是基于傅里叶变换规则得到的,当然还可以是采用其它的规则,而在转化的过程中,还可以根据实际需要设置加窗、图像二值化等处理,又或者是对采样率进行相关设置。通过这样的方式,即使是得到一段音频,例如获取到某个人的说话录音,也可以将其转化为检体语谱图,并进行后续处理。

步骤s20,在接收到基于所述检体语谱图的音素选择指令时,在所述检体语谱图中确定对应的检体音素点,并在所述样本语谱图中确定与所述检体音素点对应的样本音素点;

本实施例中,在得到检体语谱图和样本语谱图时,用户可在计算机进行操作,针对检体语谱图中选择一个或多个音素,触发对应的音素选择指令,为说明方便,本实施例中以选择一个音素为例进行说明。值得说明的是,音素(phone),是根据语音的自然属性划分出来的最小语音单位,依据音节里的发音动作来分析,一个动作构成一个音素,如“普通话”,由三个音节组成,可以分析成“p,u,t,o,ng,h,u,a”八个音素。本实施例中,计算机在接收到基于检体语谱图的音素选择指令时,首先可在检体语谱图中确定对应的检体音素点,也即用户选择了哪一个音素,该音素在检体语谱图中对应了哪一个点;然后,计算机将在样本语谱图中确定与检体音素点对应的样本音素点,其中,检体音素点与样本音素点对应同一个音素。值得说明的是,对于一个检体音素点,在样本语谱图中可能是具有一个或多个对应的样本音素点,为说明方便,本实施例中以一个样本音素点为例进行说明;换而言之,本步骤是就同一个音素分别在检体语谱图和样本语谱图中确定对应的音素点。

步骤s30,获取所述检体音素点的检体音素属性,并获取所述样本音素点的样本音素属性;

本实施例中,在确定检体音素点和样本音素点时,由于检体音素点是记录于检体语谱图中,因此计算机可通过检体语谱图获取该检体音素点对应的检体音素属性,例如时间、频率、幅度、能量等;类似的,由于样本音素点是记录于样本语谱图中,因此计算机也可通过样本语谱图获取该样本音素点对应的样本音素属性,例如时间、频率、幅度、能量等。

步骤s40,根据所述检体音素属性和所述样本音素属性,计算所述检体音素点和所述样本音素点的音素相似度,并根据所述音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度。

本实施例中,得到检体音素属性和样本音素属性时,计算机可根据检体音素属性和样本音素属性,计算检体音素点和样本音素点的音素相似度;该音素相似度可认为是检体语谱图和样本语谱图两者对同一音素的发音差异程度的表征;其中,音素相似度越大,则检体语谱图和样本语谱图两者对同一音素的发音差异越小;音素相似度越小,则检体语谱图和样本语谱图两者对同一音素的发音差异越大。

具体的,步骤“根据所述检体音素属性和所述样本音素属性,计算所述检体音素点和所述样本音素点的音素相似度”包括:

步骤a1,将所述检体音素属性转换为对应的检体音素向量,并将所述样本音素属性转换为对应的样本音素向量;

本实施例中,对于计算音素相似度的过程,首先计算机要将检体音素属性转为对于的检体音素向量,并将样本音素属性转换为对应的样本音素向量。其中,两者的转换规则,应该是一致的;具体的,对于向量中的音素属性,包括a、b、c,且排列顺序依次为a、b、c,则首先将取出检体音素属性中a、b、c这三种类型的属性,并根据一定的数值映射关系映射为对于的属性数值,然后按a、b、c的顺序进行排序,即获得了检体音素属性对应的检体音素向量;类似的,可获得样本音素属性转换为对应的样本音素向量。其中,向量中所包括的音素属性类型、各音素属性的排序顺序、属性与数值之间的数值映射关系可根据实际情况进行设置。

步骤a2,计算所述检体音素向量和所述样本音素向量的向量相似度,根据所述向量相似度确定所述音素相似度。

在得到检体音素向量和样本音素向量时,计算机可计算检体音素向量和样本音素向量之间的向量相似度,然后根据该向量相似度确定音素相似度,例如可以是直接将向量相似度作为音素相似度,又或者是一定的线性变换处理。其中,对于检体音素向量和样本音素向量之间的向量相似度的计算,可以是根据实际需要采用不同的公式,例如可以是基于余项相似度公式进行计算,又或者是基于欧式距离公式、切比雪夫距离公式等距离公式进行计算。通过上述方式,将检体音素属性和样本音素属性分别转换为向量,并用以进行相似度计算,从而量化的表征音素点之间相似度,方便后续对语谱图之间的匹配关系进行量化描述。

在计算得到音素相似度时,由于音素相似度可认为是检体语谱图和样本语谱图两者对同一音素的发音差异程度的表征,因而可根据音素相似度确定检体语谱图与样本语谱图的语谱图匹配度,从而从音素属性出发,根据同一音素在不同语谱图的音素属性关系对语谱图之间的匹配关系进行量化描述。而在根据音素相似度确定检体语谱图与样本语谱图的语谱图匹配度时,可以是将音素相似度作为语谱图匹配度;或者对音素相似度进行一定的线性变换处理得到语谱图匹配度;又或者是预先设置不同的相似度范围,不同的相似度范围对应不同的语谱图匹配度,然后根据音素相似度所处的相似度范围确定对应的语谱图匹配度。

进一步地,在步骤s40之后,该语谱图匹配方法还包括:

显示所述检体音素属性、所述样本音素属性、所述音素相似度和所述语谱图匹配度。

本实施例中,计算机在计算得到语谱图匹配度时,还可以在屏幕上显示检体音素属性、样本音素属性、音素相似度和语谱图匹配度。通过上述方式,方便用户获知语谱图匹配的过程以及涉及的具体参数,方便用户从数值化的角度了解语谱图匹配的具体情况。

本发明实施例提供一种推荐方法,通过获取检体语谱图,并获取样本语谱图;在接收到基于所述检体语谱图的音素选择指令时,在所述检体语谱图中确定对应的检体音素点,并在所述样本语谱图中确定与所述检体音素点对应的样本音素点;获取所述检体音素点的检体音素属性,并获取所述样本音素点的样本音素属性;根据所述检体音素属性和所述样本音素属性,计算所述检体音素点和所述样本音素点的音素相似度,并根据所述音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度。通过上述方式,本实施例根据接收到音素选择指令在所述检体语谱图中确定对应的检体音素点,同时在样本语谱图中确定与检体音素点对应的样本音素点,然后根据互相对应的音素点各自的音素属性计算音素点之间的音素相似度,并通过对应音素点之间的音素相似来确定语谱图匹配度,从而从音素属性出发,根据同一音素在不同语谱图的音素属性关系对语谱图之间的匹配关系进行量化描述,有利于提高语谱图匹配判断的准确性。

基于上述语谱图匹配方法第一实施例,提出本发明语谱图匹配方法第二实施例。

本实施例中,所述样本语谱图中同一检体音素点对应的检体音素点数量为两个以上,步骤s40包括:

步骤b1,根据所述检体音素属性和所述样本音素属性,分别计算所述检体音素点与各样本音素点之间的音素相似度;

本实施例中,对于一个检体音素点,在样本语谱图中具有两个以上对应的样本音素点(也即样本语谱图中同一检体音素点对应的检体音素点数量为两个以上)。此时,在计算音素相似度时,是根据检体音素属性和样本音素属性,分别计算检体音素点与各样本音素点之间的音素相似度。例如,检体音素点为m,而在检体音素点在样本语谱图对应的样本音素点为n1、n2、n3;对此,可分别计算检体音素点m和样本音素点为n1的音素相似度smn1、检体音素点m和样本音素点为n2的音素相似度smn2、检体音素点m和样本音素点为n3的音素相似度smn3。

步骤b2,根据各音素相似度获取第一综合音素相似度,并根据所述第一综合音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度。

在得到各音素相似度之后,可根据各音素相似度获取第一综合音素相似度;而对于第一综合音素相似度的获取,可以是取各音素相似度的均值,又或者是取各音素相似度的中位数,又或者是取各音素相似度的最大值或最小值等。在得到第一综合音素相似度时,即可根据第一综合音素相似度确定检体语谱图与样本语谱图的语谱图匹配度,具体确定过程如根据音素相似度确定检体语谱图与样本语谱图的语谱图匹配度,此处不再赘述。

通过上述方式,本实施例在样本语谱图中同一检体音素点对应的检体音素点数量为两个以上的情况下,可分别计算检体音素点与各样本音素点之间的音素相似度,并综合各音素相似度来确定语谱图匹配度,从而综合考虑多样本音素点的相似度情况,有利于提高语谱图匹配判断的准确性。

基于上述语谱图匹配方法第一实施例,提出本发明语谱图匹配方法第三实施例。

本实施例中,所述检体音素点的数量为两个以上,步骤s40包括:

步骤b3,根据所述检体音素属性和所述样本音素属性,分别计算各检体音素点与对应样本音素点之间的音素相似度;

本实施例中,用户在计算机操作针对检体语谱图中选择音素触发音素选择指令时,选择了两个以上的检体因素,而计算机根据该音素选择指令确定了两个以上的检体音素点。此时,在计算音素相似度时,是根据检体音素属性和样本音素属性,分别计算各检体音素点与对应样本音素点之间的音素相似度。例如,检体音素点为m1、m2、m3,而检体音素点m1在样本语谱图对应的样本音素点为n4,检体音素点m2在样本语谱图对应的样本音素点为n5,检体音素点m3在样本语谱图对应的样本音素点为n6;对此,可分别计算检体音素点m1和样本音素点为n4的音素相似度sm1n4、检体音素点m2和样本音素点为n5的音素相似度sm2n5、检体音素点m3和样本音素点为n6的音素相似度sm3n6。

步骤b4,根据各音素相似度获取第二综合音素相似度,并根据所述第二综合音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度。

在得到各音素相似度之后,可根据各音素相似度获取第二综合音素相似度;而对于第二综合音素相似度的获取,可以是取各音素相似度的均值,又或者是取各音素相似度的中位数,又或者是取各音素相似度的最大值或最小值等。在得到第二综合音素相似度时,即可根据第二综合音素相似度确定检体语谱图与样本语谱图的语谱图匹配度,具体确定过程如根据音素相似度确定检体语谱图与样本语谱图的语谱图匹配度,此处不再赘述。

值得说明的是,在实际应用中,有可能既选择了两个以上的检体音素点,且至少一个检体音素点对应的样本音素点的数量两个以上。此时,对于音素相似度的计算和语谱图匹配度的计算,可以是先针对每个检体音素点与对应样本音素点之间的第一综合音素相似度,具体过程参照第二实施例;然后再根据第一综合音素相似度获取对应的第二综合音素相似度,并根据第二综合音素相似度确定语谱图匹配度,具体过程参照第三实施例。

通过上述方式,本实施例检体音素点为两个以上的情况下,可分别计算各检体音素点与对应样本音素点之间的音素相似度,并综合各音素相似度来确定语谱图匹配度,从而综合考虑多检体音素点的相似度情况,有利于提高语谱图匹配判断的准确性。

基于上述语谱图匹配方法第一实施例,提出本发明语谱图匹配方法第四实施例。

本实施例中,所述步骤s40之后,还包括:

步骤a,判断所述语谱图匹配度是否大于预设阈值;

本实施例中的语谱图匹配过程,可以是应用于语音身份识别的过程中,也即将检体语谱图将样本语谱图进行匹配,以根据语谱图匹配度判断检体语谱图所对应的检体身份。具体的,在得到检体语谱图与样本语谱图的语谱图匹配度时,计算机可将语谱图匹配度与一预设阈值进行比较,判断语谱图匹配度是否大于预设阈值。

步骤b,若所述语谱图匹配度大于预设阈值,则获取所述样本语谱图对应的样本身份信息,并根据所述样本身份信息确定所述检体语谱图的检体身份信息。

本实施例中,若语谱图匹配度小于或等于预设阈值,则可认为检体语谱图将样本语谱图的匹配度较低,两者不属于同一身份;而若语谱图匹配度大于预设阈值,则可认为检体语谱图将样本语谱图的匹配度较高,两者属于同一身份,此时计算机可获取样本语谱图对应的样本身份信息,并根据该样本身份信息确定检体语谱图的检体身份信息,也即确定检体语谱图所对应的检体身份。

通过上述方式,本实施例的语谱图匹配过程可应用于语音身份识别的过程中,而若语谱图匹配度大于预设阈值,则可认为检体语谱图将样本语谱图的匹配度较高,两者属于同一身份,此时计算机可获取样本语谱图对应的样本身份信息,并根据该样本身份信息确定检体语谱图的检体身份信息,实现语音身份识别。

此外,本发明实施例还提供一种语谱图匹配装置。

参照图3,图3为本发明语谱图匹配装置第一实施例的功能模块示意图。

本实施例中,所述语谱图匹配装置包括:

语谱图获取模块10,用于获取检体语谱图,并获取样本语谱图;

音素点获取模块20,用于在接收到基于所述检体语谱图的音素选择指令时,在所述检体语谱图中确定对应的检体音素点,并在所述样本语谱图中确定与所述检体音素点对应的样本音素点;

属性获取模块30,用于获取所述检体音素点的检体音素属性,并获取所述样本音素点的样本音素属性;

匹配度确定模块40,用于根据所述检体音素属性和所述样本音素属性,计算所述检体音素点和所述样本音素点的音素相似度,并根据所述音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度。

其中,上述语谱图匹配装置的各虚拟功能模块存储于图1所示语谱图匹配设备的存储器1005中,用于实现语谱图匹配程序的所有功能;各模块被处理器1001执行时,可实现语谱图匹配的功能。

进一步地,所述语谱图获取模块10包括:

语谱图转换单元,用于获取检体音频,并基于预设规则将所述检体音频转化为检体语谱图。

进一步地,所述匹配度确定模块40包括:

向量转换单元,用于将所述检体音素属性转换为对应的检体音素向量,并将所述样本音素属性转换为对应的样本音素向量;

相似度计算单元,用于计算所述检体音素向量和所述样本音素向量的向量相似度,根据所述向量相似度确定所述音素相似度。

进一步地,所述样本语谱图中同一检体音素点对应的检体音素点数量为两个以上,

所述匹配度确定模块40包括:

第一计算单元,用于根据所述检体音素属性和所述样本音素属性,分别计算所述检体音素点与各样本音素点之间的音素相似度;

第一确定单元,用于根据各音素相似度获取第一综合音素相似度,并根据所述第一综合音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度。

进一步地,所述检体音素点的数量为两个以上,

所述匹配度确定模块40包括:

第二计算单元,用于根据所述检体音素属性和所述样本音素属性,分别计算各检体音素点与对应样本音素点之间的音素相似度;

第二确定单元,用于根据各音素相似度获取第二综合音素相似度,并根据所述第二综合音素相似度确定所述检体语谱图与样本语谱图的语谱图匹配度。

进一步地,所述语谱图匹配装置还包括:

显示模块,用于显示所述检体音素属性、所述样本音素属性、所述音素相似度和所述语谱图匹配度。

进一步地,所述语谱图匹配装置还包括:

匹配度判断模块,用于判断所述语谱图匹配度是否大于预设阈值;

信息确定模块,用于若所述语谱图匹配度大于预设阈值,则获取所述样本语谱图对应的样本身份信息,并根据所述样本身份信息确定所述检体语谱图的检体身份信息。

其中,上述语谱图匹配装置中各个模块的功能实现与上述语谱图匹配方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。

此外,本发明实施例还提供一种计算机可读存储介质。

本发明计算机可读存储介质上存储有语谱图匹配程序,其中所述语谱图匹配程序被处理器执行时,实现如上述的语谱图匹配方法的步骤。

其中,语谱图匹配程序被执行时所实现的方法可参照本发明语谱图匹配方法的各个实施例,此处不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

相关标签: 关系处理
tips