语音设备及其唤醒方法、装置以及存储介质与流程

2021-01-28 13:01:28|

252|

起点商标网

本发明涉及语音技术领域，尤其涉及一种语音设备及其唤醒方法、装置以及存储介质。

背景技术：

随着家电产品越来越智能化，语音识别技术日趋成熟，语音识别技术应用到家电产品已成趋势。目前，很多用户家庭普遍存在多种品类的语音设备，而各语音设备的唤醒方式大都相同，由此容易导致一次操作同时唤醒多个设备的情况的发生，影响用户使用。

技术实现要素：

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本发明的第一个目的在于提出一种语音设备的唤醒方法，以实现在有多个语音设备响应语音唤醒指令时唯一唤醒语音设备。

本发明的第二个目的在于提出一种语音设备的唤醒装置。

本发明的第三个目的在于提出一种计算机可读存储介质。

本发明的第四个目的在于提出一种语音设备。

为达到上述目的，本发明第一方面实施例提出一种语音设备的唤醒方法，所述方法包括以下步骤：第一语音设备在接收到语音唤醒指令后，根据所述语音唤醒指令得到用户信息；所述第一语音设备将所述用户信息与自身的能力值进行匹配，得到匹配度；所述第一语音设备获取至少一个第二语音设备得到的匹配度，并根据多个匹配度确定所述第一语音设备自身是否进入交互环节；所述第一语音设备确定自身进入交互环节时，发出提示信息，以进行被唤醒提醒。

本发明实施例的语音设备的唤醒方法，通过第一语音设备在接收到语音唤醒指令后，根据语音唤醒指令得到用户信息；第一语音设备将用户信息与自身的能力值进行匹配，得到匹配度；进而第一语音设备获取至少一个第二语音设备得到的匹配度，并根据多个匹配度确定第一语音设备自身是否进入交互环节；从而第一语音设备确定自身进入交互环节时，发出提示信息，以进行被唤醒提醒。由此，可以根据语音唤醒指令提取得到用户信息，进而根据用户信息实现对响应语音唤醒指令的语音设备进行识别，从而实现在有多个语音设备响应语音唤醒指令时唯一唤醒语音设备。

为达到上述目的，本发明第二方面实施例提出一种语音设备的唤醒装置，所述唤醒装置包括获得模块，用于在多个语音设备接收到语音唤醒指令后，根据所述语音唤醒指令得到用户信息；匹配模块，用于将所述用户信息与所述唤醒装置所述语音设备的能力值进行匹配，得到匹配度；其中，所述获得模块，还用于获取至少一个第二语音设备的匹配度；确定模块，用于根据多个匹配度，确定所述唤醒装置所属语音设备是否进入交互环节；提示模块，用于在所述唤醒装置所属语音设备进入交互环节时，发出提示信息，以进行被唤醒提醒。

本发明实施例的语音设备的唤醒装置，通过获得模块在多个语音设备接收到语音唤醒指令后，根据语音唤醒指令得到用户信息；并通过匹配模块将用户信息与唤醒装置语音设备的能力值进行匹配，得到匹配度；其中，获得模块，还用于获取至少一个第二语音设备的匹配度；进而通过确定模块根据多个匹配度，确定唤醒装置所属语音设备是否进入交互环节；从而根据提示模块在唤醒装置所属语音设备进入交互环节时，发出提示信息，以进行被唤醒提醒。由此，可以根据语音唤醒指令提取得到用户信息，进而根据用户信息实现对响应语音唤醒指令的语音设备进行识别，从而实现在有多个语音设备响应语音唤醒指令时唯一唤醒语音设备。

为达到上述目的，本发明第三方面实施例提出一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现上述的语音设备的唤醒方法。

本发明实施例的计算机可读存储介质，在其上存储的计算机程序被处理器执行时，可以根据语音唤醒指令提取得到用户信息，进而根据用户信息实现对响应语音唤醒指令的语音设备进行识别，从而实现在有多个语音设备响应语音唤醒指令时唯一唤醒语音设备。

为达到上述目的，本发明第四方面实施例提出一种语音设备，包括上述的语音设备的唤醒装置；或者，存储器、处理器和存储在所述存储器上的计算机程序，所述计算机程序被所述处理器执行时，实现上述的语音设备的唤醒方法。

本发明实施例的语音设备，通过上述的语音设备的唤醒装置，或者，通过实现上述的语音设备的唤醒方法，可以根据语音唤醒指令提取得到用户信息，进而根据用户信息实现对响应语音唤醒指令的语音设备进行识别，从而实现在有多个语音设备响应语音唤醒指令时唯一唤醒语音设备。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

图1是本发明第一实施例的语音设备的唤醒方法的流程图；

图2是本发明第二实施例的语音设备的唤醒方法的流程图；

图3是本发明第三实施例的语音设备的唤醒方法的流程图；

图4是本发明一个具体实施例的语音设备的唤醒方法的流程示意图；

图5是本发明实施例的语音设备的唤醒装置的结构框图；

图6是本发明一个实施例的语音设备的结构框图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的语音设备及其唤醒方法、装置以及存储介质。

图1是本发明一个实施例的语音设备的唤醒方法的流程图。

如图1所示，语音设备的唤醒方法包括以下步骤：

s11，第一语音设备在接收到语音唤醒指令后，根据语音唤醒指令得到用户信息。

具体地，在用户发出语音唤醒指令后，第一语音设备接收到语音唤醒指令并响应该指令，进而根据该语音唤醒指令得到用户信息。其中，用户信息可包括发出语音唤醒指令的用户的身份信息，如用户的年龄信息、id信息等，年龄可以是分别对应不同的年龄区间的儿童、成年人、老人等，也可以是具体的年龄值，由此，可对语音唤醒指令进行声纹识别，确定发出语音唤醒指令的用户的年龄或id信息。

需要说明的是，对于不同的语音设备，与其对应的唤醒指令可能会相同，如都是“小美小美”语音。因而在用户发出语音唤醒指令后，不仅上述第一语音设备会响应该指令，多个处于同一局域网内的具有与第一语音设备相同的唤醒指令的第二语音设备同样会响应该指令，进而导致在用户下达语音唤醒指令后，可能会有多个语音设备响应该语音唤醒指令，上述多个第二语音设备中可能包括用户希望不响应该指令的语音设备。因而在用户发出语音唤醒指令之后，需要对响应语音唤醒指令的语音设备进行识别。因而，语音设备在响应语音唤醒指令后，可以根据语音唤醒指令得到用户信息。

可选地，在根据语音唤醒指令得到用户信息之前，还可根据语音唤醒指令得到唤醒能量值，以对语音设备进行初步唤醒识别。

s12，第一语音设备将用户信息与自身的能力值进行匹配，得到匹配度。

其中，语音设备的能力值可包括根据用户的身份信息划分的能力值，换言之，语音设备的能力值可包括语音设备可实现的功能内容，该功能可内容根据用户的年龄划分。其中，划分方式可以是出厂设定的，也可以是自定义设置的。

具体地，第一语音设备可以根据语音唤醒指令进行声纹识别，得到用户信息，并将用户信息与自身的能力值进行匹配，获得匹配度。进而上述第二语音设备也可得到用户信息，并将用户信息与自身的能力值进行匹配，获得匹配度。其中，以用户的身份信息包括用户的年龄为例，第一语音设备将用户信息与自身的能力值进行匹配，得到匹配度，可包括：第一语音设备获取自身的能力值匹配度-年龄曲线，根据用户的年龄和能力值匹配度-年龄曲线得到匹配度。

其中，能力值匹配度-年龄曲线可以是连续曲线，该连续曲线的整体趋势是单调的，即一个年龄对应一个匹配度；能力值匹配度-年龄曲线也可以是分段曲线，且该分段曲线的整体趋势是单调的，即一个年龄范围只对应一个匹配度。

作为一个示例，假设有一台智能音响与一台柜机空调，其具有相同的语音唤醒指令“小美小美”，可以设置智能音箱的能力值适用于儿童，柜机空调的能力值适用于老人。在用户发出语音唤醒指令“小美小美”后，若智能音响、柜机空调均根据语音唤醒指令识别到用户信息为老人，则智能音响、柜机空调均对用户信息与自身的能力值进行匹配，得到相应的匹配结果(如智能音响得到的匹配度为0.1，柜机空调的匹配度为0.9)；进而可广播匹配度，以便智能音响、柜机空调均能得到对方的匹配度；也可将匹配度均发送至局域网内的特定设备(可以是特定的控制设备，也可以是多个语音设备中的一个)或者云端服务器，以便比对各匹配度。

s13，第一语音设备获取至少一个第二语音设备得到的匹配度，并根据多个匹配度确定第一语音设备自身是否进入交互环节。

具体地，第一语音设备将自身的匹配度与各第二语音设备的匹配度进行比较，确定自身的匹配度是否最大；如果自身的匹配度最大，则第一语音设备确定自身进入交互环节。

作为一个示例，如图4所示，在用户发出语音唤醒指令“小美小美”后，有多个语音设备响应该语音唤醒指令，多个语音设备均根据语音唤醒指令得到唤醒能量值，以进行初步唤醒识别，以初步确定待唤醒的语音设备，如语音设备1与语音设备2。两语音设备进一步根据语音唤醒指令获取用户信息，进而进行用户信息匹配，得到用户信息与能力值的匹配度，得到各自的匹配度并广播。假设语音设备1得到的匹配度大于语音设备2得到的匹配度，则语音设备1被唤醒进入交互环节，语音设备2不被唤醒。其中，被唤醒进入交互环节，是指可接收识别语音，并可发出语音；不被唤醒可以是指只可接收识别语音，并不可发出语音。

s14，第一语音设备确定自身进入交互环节时，发出提示信息，以进行被唤醒提醒。

由此，该语音设备的唤醒方法，可以根据语音唤醒指令提取得到用户信息，进而根据用户信息实现对响应语音唤醒指令的语音设备进行识别，从而实现在有多个语音设备响应语音唤醒指令时唯一唤醒语音设备。

在本发明的一个实施例中，如图2所示，语音设备的唤醒方法还可包括：

s21，第一语音设备根据接收到的语音唤醒指令得到唤醒能量值，并将唤醒能量值与自身的预设能量阈值进行比较。

具体地，在用户发出语音唤醒指令且语音设备响应该语音唤醒指令后，第一语音设备还可根据接收到的语音唤醒指令进行语音能量计算，得到唤醒能量值，并可将唤醒能量值与自身的预设能量阈值进行比较。

进一步地，第二语音设备也可根据接收到的语音唤醒指令进行语音能量计算，得到唤醒能量值，并可将唤醒能量值与自身的预设能量阈值进行比较。

可选地，第一语音设备与第二语音设备还可将得到的唤醒能量值在局域网内进行广播，也可将唤醒能量值发送至局域网内的特定设备或者云端服务器。

s22，如果唤醒能量值大于或等于自身的预设能量阈值，则第一语音设备确定是否存在至少一个第二语音设备的唤醒能量值大于或等于自身的预设能量阈值。

其中，上述预设能量阈值可以由用户自行设置，也可使用语音设备默认的阈值。

s23，如果存在至少一个第二语音设备的唤醒能量值大于或等于自身的预设能量阈值，则第一语音设备执行根据语音唤醒指令得到用户需求信息的步骤。

作为一个示例，如果不存在至少一个第二语音设备的唤醒能量值大于或等于自身的预设能量阈值，则第一语音设备确定自身直接进入交互环节。即，如若所有第二语音设备的唤醒能量值均小于等于对应的预设能量阈值，则可说明与第一语音设备是唯一通过了唤醒能量值识别的语音设备，可认为第一语音设备即是用户希望响应语音唤醒指令的语音设备。此时，可直接唤醒第一语音设备，而不用执行上述步骤s11-s13。

如果存在至少一个第二语音设备的唤醒能量值大于或等于自身的预设能量阈值，则说明有多个语音设备通过了唤醒能量值识别，进而需要对上述语音设备进行进一步的识别。具体地，根据用户指令对上述语音设备进行进一步的识别，即执行上述步骤s11-s14。

需要说明的是，如果第一语音设备的唤醒能量值小于自身的预设能量阈值，则计算唤醒能量值与自身的预设能量阈值之间的差值，得到差值绝对值，并获取至少一个第二语音设备的差值绝对值；第一语音设备将自身的差值绝对值与至少一个第二语音设备的差值绝对值进行比较，确定自身的差值绝对值是否最大；如果自身的差值绝对值最大，则第一语音设备确定自身进入交互环节。

由此，可以实现在对响应语音唤醒指令的语音设备根据用户信息进行识别之前，根据唤醒能量值对语音设备进行初步识别，进一步保证了语音设备的唯一唤醒。

在本发明的一个实施例中，如图3所示，上述第一语音设备根据接收到的语音唤醒指令得到唤醒能量值可以包括：

s31，第一语音设备根据接收到的语音唤醒指令，得到语音能量值。

s32，第一语音设备获取接收到语音唤醒指令的时刻，并获取至少一个第二语音设备接收到语音唤醒指令的时刻。

s33，第一语音设备根据语音能量值和多个时刻，得到唤醒能量值。

具体地，在用户发出语音唤醒指令后，第一语音设备接收该语音唤醒指令，并获取语音唤醒指令的特征数据，进而第一语音设备获取至少一个第二语音设备接收到语音唤醒指令的时刻，从而根据该特征数据和上述至少一个第二语音设备接收到语音唤醒指令的时刻生成与语音设备对应的唤醒能量值。

其中，上述语音设备可通过设置在设备上的传感器(例如麦克风)采集用户发出的语音唤醒指令。上述特征数据可以包括第一语音设备采集到该语音唤醒指令的时刻、第一语音设备采集到的语音唤醒指令的语音能量值。

可选地，语音设备在获取到语音唤醒指令的特征数据后，可将该特征数据转换为一个数字值，进而将该数字值作为唤醒能量值。例如，语音设备的个数为n，可根据式q＝q1*bi得到唤醒能量值，其中，q为唤醒能量值，q1为语音能量值，i＝1,2,…,n，b1+b2+…+bn＝1，b1＞b2＞…＞bn，bi为时刻排序在第i位的语音唤醒指令对应的参数。

综上，本发明实施例的语音设备的唤醒方法，可以根据语音唤醒指令提取得到用户信息，进而根据用户信息实现对响应语音唤醒指令的语音设备进行识别，从而实现在有多个语音设备响应语音唤醒指令时唯一唤醒语音设备。而且，还可以根据语音唤醒指令提取得到唤醒能量值，进而根据唤醒能量值对语音设备进行初步识别，从而更好地实现唯一唤醒语音设备。

图5是本发明实施例的语音设备的唤醒装置的结构框图。

如图5所示，该语音设备的唤醒装置100包括获得模块101、匹配模块102、确定模块103、提示模块104。

具体地，获得模块101，用于在接收到语音唤醒指令后，根据语音唤醒指令得到用户信息；匹配模块102，用于将用户信息与唤醒装置语音设备的能力值进行匹配，得到匹配度；其中，获得模块101，还用于获取至少一个第二语音设备的匹配度；确定模块103，用于根据多个匹配度，确定唤醒装置所属语音设备是否进入交互环节；提示模块104，用于在唤醒装置所属语音设备进入交互环节时，发出提示信息，以进行被唤醒提醒。

该语音设备的唤醒装置，可以根据语音唤醒指令提取得到用户信息，进而根据用户信息实现对响应语音唤醒指令的语音设备进行识别，从而实现在有多个语音设备响应语音唤醒指令时唯一唤醒语音设备。

在本发明的一个实施例中，确定模块103具体用于：第一语音设备将自身的匹配度与各第二语音设备的匹配度进行比较，确定自身的匹配度是否最大；如果自身的匹配度最大，则第一语音设备确定自身进入交互环节。

在本发明的一个实施例中，匹配模块102还可用于：第一语音设备根据接收到的语音唤醒指令得到唤醒能量值，并将唤醒能量值与自身的预设能量阈值进行比较；如果唤醒能量值大于或等于自身的预设能量阈值，则第一语音设备确定是否存在至少一个第二语音设备的唤醒能量值大于或等于自身的预设能量阈值；如果存在至少一个第二语音设备的唤醒能量值大于或等于自身的预设能量阈值，则第一语音设备执行根据语音唤醒指令得到用户需求信息的步骤。

在本发明的一个实施例中，匹配模块102还可用于：如果不存在至少一个第二语音设备的唤醒能量值大于或等于自身的预设能量阈值，则第一语音设备确定自身直接进入交互环节。

在本发明的一个实施例中，匹配模块102还可用于：如果第一语音设备的唤醒能量值小于自身的预设能量阈值，则计算唤醒能量值与自身的预设能量阈值之间的差值，得到差值绝对值，并获取至少一个第二语音设备的差值绝对值；第一语音设备将自身的差值绝对值与至少一个第二语音设备的差值绝对值进行比较，确定自身的差值绝对值是否最大；如果自身的差值绝对值最大，则第一语音设备确定自身进入交互环节。

在本发明的一个实施例中，匹配模块102还可用于：第一语音设备根据接收到的语音唤醒指令，得到语音能量值；第一语音设备获取接收到语音唤醒指令的时刻，并获取至少一个第二语音设备接收到语音唤醒指令的时刻；第一语音设备根据语音能量值和多个时刻，得到唤醒能量值。

在本发明的一个实施例中，匹配模块102还可用于：用户信息包括发出语音唤醒指令的用户的身份信息，语音设备的能力值包括根据用户的身份信息划分的能力值。

需要说明的是，语音设备的唤醒装置的其他具体实施方式，可以参见上述的语音设备的唤醒方法。

综上，本发明实施例的语音设备的唤醒装置，可以根据语音唤醒指令提取得到用户信息，进而根据用户信息实现对响应语音唤醒指令的语音设备进行识别，从而实现在有多个语音设备响应语音唤醒指令时唯一唤醒语音设备。而且，还可以根据语音唤醒指令提取得到唤醒能量值，进而根据唤醒能量值对语音设备进行初步识别，从而更好地实现唯一唤醒语音设备。

进一步地，本发明提出一种计算机可读存储介质。

在本发明实施例中，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时，实现上述的语音设备的唤醒方法。

本发明实施例的计算机可读存储介质，在其上的计算机程序被处理器执行时，可以根据语音唤醒指令提取得到用户信息，进而根据用户信息实现对响应语音唤醒指令的语音设备进行识别，从而实现在有多个语音设备响应语音唤醒指令时唯一唤醒语音设备。而且，还可以根据语音唤醒指令提取得到唤醒能量值，进而根据唤醒能量值对语音设备进行初步识别，从而更好地实现唯一唤醒语音设备。

进一步地，本发明提出一种语音设备。

图6是本发明一个实施例的语音设备的结构框图。

在该实施例中，如图6所示，语音设备1000包括上述实施例的上述的语音设备的唤醒装置100。

在本发明的另一个实施例中，语音设备包括存储器、处理器和存储在存储器上的计算机程序，该计算机程序被所述处理器执行时，实现上述的语音设备的唤醒方法。

本发明实施例的语音设备，通过上述的语音设备的唤醒装置，或者，实现上述的语音设备的唤醒方法，可以根据语音唤醒指令提取得到用户信息，进而根据用户信息实现对响应语音唤醒指令的语音设备进行识别，从而实现在有多个语音设备响应语音唤醒指令时唯一唤醒语音设备。而且，还可以根据语音唤醒指令提取得到唤醒能量值，进而根据唤醒能量值对语音设备进行初步识别，从而更好地实现唯一唤醒语音设备。

需要说明的是，在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(ram)，只读存储器(rom)，可擦除可编辑只读存储器(eprom或闪速存储器)，光纤装置，以及便携式光盘只读存储器(cdrom)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

在本发明中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系，除非另有明确的限定。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

在本发明中，除非另有明确的规定和限定，第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触，或第一和第二特征通过中间媒介间接接触。而且，第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方，或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方，或仅仅表示第一特征水平高度小于第二特征。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除