智能设备交互方法与流程

2021-01-28 13:01:19|

255|

起点商标网

本发明涉及智能家居领域，具体而言，涉及一种智能设备交互方法。

背景技术：

当前智能家居在家庭中的使用越来越普及。很多家庭为方便与智能设备进行交互，会部署多个具有唤醒和交互功能的智能设备。

因此在用户对智能设备进行交互唤醒时，会出现多个智能设备同时应答的情况，而多个智能设备同时处理应答，与用户交互，既浪费资源，还会导致交互信息混乱，使得智能设备无法与用户进行正常交互。

针对上述的问题，目前尚未提出有效的解决方案。

技术实现要素：

本发明实施例提供了一种智能设备交互方法，以至少解决多个智能设备同时响应交互导致无法正常交互的技术问题。

根据本发明实施例的一个方面，提供了一种智能设备交互方法，包括：获取第一语音设备所关联的目标区域内的至少两个第二语音设备分别发送的唤醒信息，其中，上述唤醒信息中至少携带有上述第二语音设备对上述目标区域内的目标对象的语音唤醒指令的识别结果以及上述第二语音设备对上述目标对象的识别信息，上述第一语音设备与上述第二语音设备中分别包括用于采集语音信号的语音采集模块；比对上述至少两个第二语音设备各自的唤醒信息，得到比对结果；根据上述比对结果从上述至少两个第二语音设备中选出目标语音设备，并建立与上述目标语音设备之间的目标交互通道；基于上述目标交互通道与上述目标语音设备进行音频信息的交互。

根据本发明实施例的一个方面，还提供了一种智能设备交互方法，包括：获取唤醒信息，其中，上述唤醒信息中至少携带有第二语音设备对目标区域内的目标对象的语音唤醒指令的识别结果以及上述第二语音设备对上述目标对象的识别信息，上述第二语音设备中包括用于采集语音信号的语音采集模块；将上述唤醒信息发送给第一语音设备，以使上述第一语音设备比对至少两个上述第二语音设备各自的唤醒信息，选出目标语音设备，其中，上述第一语音设备中包括用于采集语音信号的语音采集模块；在被确定为上述目标语音设备的情况下，建立与上述第一语音设备之间的目标交互通道；基于上述目标交互通道与上述第一语音设备进行音频信息的交互。

根据本发明实施例的另一方面，还提供了一种智能设备交互装置，包括：获取模块，用于获取第一语音设备所关联的目标区域内的至少两个第二语音设备分别发送的唤醒信息，其中，上述唤醒信息中至少携带有上述第二语音设备对上述目标区域内的目标对象的语音唤醒指令的识别结果以及上述第二语音设备对上述目标对象的识别信息，上述第一语音设备与上述第二语音设备中分别包括用于采集语音信号的语音采集模块；比对模块，用于比对上述至少两个第二语音设备各自的唤醒信息，得到比对结果；确定模块，用于根据上述比对结果从上述至少两个第二语音设备中选出目标语音设备；建立模块，用于建立与上述目标语音设备之间的目标交互通道；交互模块，用于基于上述目标交互通道与上述目标语音设备进行音频信息的交互。

根据本发明实施例的另一方面，还提供了一种智能设备交互装置，包括：获取模块，用于获取唤醒信息，其中，上述唤醒信息中至少携带有第二语音设备对目标区域内的目标对象的语音唤醒指令的识别结果以及上述第二语音设备对上述目标对象的识别信息，上述第二语音设备中包括用于采集语音信号的语音采集模块；发送模块，用于将上述唤醒信息发送给第一语音设备，以使上述第一语音设备比对至少两个上述第二语音设备各自的唤醒信息，选出目标语音设备，其中，上述第一语音设备中包括用于采集语音信号的语音采集模块；建立模块，用于在被确定为上述目标语音设备的情况下，建立与上述第一语音设备之间的目标交互通道；交互模块，用于基于上述目标交互通道与上述第一语音设备进行音频信息的交互。

根据本发明实施例的另一方面，还提供了一种智能设备交互系统，包括：至少两个第二语音设备，用于获取唤醒信息；第一语音设备，用于比对至少两个上述第二语音设备发送的上述唤醒信息，根据比对结果选出目标语音设备，并建立与上述目标语音设备交互的目标交互通道，通过上述目标交互通道获取语音控制信息；上述服务器，用于处理上述第一语音设备发送的上述语音控制信息，以得到语音反馈结果，并将上述语音反馈结果发送给上述第一语音设备和上述第二语音设备。

根据本发明实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述智能设备交互方法。

在本发明实施例中，采用第二语音设备采集目标对象的语音唤醒指令进行处理并将处理结果发送给第一语音设备的方式，通过第一语音设备对至少两个第二语音设备分别发送的唤醒信息进行比对从而确定与目标对象交互的目标语音设备并建立目标交互通道，达到了在多个第二语音设备中确定目标语音设备完成与目标对象智能交互的目的，从而实现了从多个智能设备中确定出用于交互的智能设备的技术效果，进而解决了多个智能设备同时响应交互导致无法正常交互的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种可选的智能设备交互方法的应用环境的示意图；

图2是根据本发明实施例的一种可选的智能设备交互方法的流程示意图；

图3是根据本发明实施例的又一种可选的智能设备交互方法的流程示意图；

图4是根据本发明实施例的又一种可选的智能设备交互方法的流程示意图；

图5是根据本发明实施例的又一种可选的智能设备交互方法的流程示意图；

图6是根据本发明实施例的又一种可选的智能设备交互方法的流程示意图；

图7是根据本发明实施例的又一种可选的智能设备交互方法的流程示意图；

图8是根据本发明实施例的又一种可选的智能设备交互方法的流程示意图；

图9是根据本发明实施例的一种可选的智能设备交互方法的结构框架的示意图；

图10是根据本发明实施例的一种可选的智能设备交互方法的交互时序示意图；

图11是根据本发明实施例的一种可选的智能设备交互装置的结构示意图；

图12是根据本发明实施例的又一种可选的智能设备交互装置的结构示意图；

图13是根据本发明实施例的一种可选的智能设备交互系统的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本发明实施例的一个方面，提供了一种智能设备交互方法，可选地，上述智能设备交互方法可以但不限于应用于如图1所示的环境中。其中，第一语音设备102与多个第二语音设备104之间建立通信连接。第一语音设备102可以但不限于通过网络110与服务器112进行交互。

可选地，在本实施例中，上述第一语音设备102和第二语音设备104可以是配置有语音采集模块的智能家居设备，可以包括但不限于以下至少之一：音箱、电视机、洗衣机、电冰箱、家居机器人、mid(mobileinternetdevices，移动互联网设备)、投影仪、智能网关、智能照明设备等。上述网络110可以包括但不限于：有线网络，无线网络，其中，该有线网络包括：局域网、城域网和广域网，该无线网络包括：蓝牙、wifi及其他实现无线通信的网络。上述服务器112可以是单一服务器，也可以是由多个服务器组成的服务器集群，或者是云服务器。上述仅是一种示例，本实施例中对此不作任何限定。

作为一种可选的实施方式，如图2所示，上述智能设备交互方法包括：

s202，获取第一语音设备所关联的目标区域内的至少两个第二语音设备分别发送的唤醒信息，其中，唤醒信息中至少携带有第二语音设备对目标区域内的目标对象的语音唤醒指令的识别结果以及第二语音设备对目标对象的识别信息，第一语音设备与第二语音设备中分别包括用于采集语音信号的语音采集模块；

s204，比对至少两个第二语音设备各自的唤醒信息，得到比对结果；

s206，根据比对结果从至少两个第二语音设备中选出目标语音设备，并建立与目标语音设备之间的目标交互通道；

s208，基于目标交互通道与目标语音设备进行音频信息的交互。

可选地，上述智能设备交互方法可以但不限于应用于目标区域内多个语音设备的交互过程中，其中，多个语音设备可以包括但不限于：主语音设备和从语音设备。这里智能设备交互方法可以但不限于应用于主语音设备，如第一语音设备为主语音设备，第二语音设备为从语音设备。此外，上述目标区域可以但不限于是第一语音设备与第二语音设备所在的区域。如第一语音设备所在的智能家庭的覆盖区域。

可选地，上述第一语音设备和第二语音设备是包括语音采集模块的智能语音设备，如智能音箱或设置有智能音箱的其他智能家居设备，如上文示例，这里不再赘述。

此外，这里的第一语音设备可以但不限于是通过网络与相应的服务器交互。第二语音设备中的语音采集模块可以但不限于包括：语音采集功能、语音识别功能、语音处理功能。其中，第二语音设备中的语音采集模块可以包括但不限于具备以下工作模式：联网工作模式、离线工作模式。上述第二语音设备中还可以包括但不限于：语音播放功能、语音定位功能、红外识别功能。

可选地，上述第一语音设备与至少两个第二语音设备具有关联关系。需要说明的是，这里的第一语音设备通过网络与目标区域内的多个第二语音设备建立关联关系，第一语音设备与第二语音设备之间的网络可以但不限于是：无线网络、有线网络，其中，该有线网络可以包括但不限于是局域网，该无线网络可以包括但不限于：蓝牙、wifi及其他实现无线通信的网络。此外，在本申请实施例中，上述第一语音设备与每一个第二语音设备之间通过网络将建立相对独立的交互通道。

可选地，上述语音唤醒指令是指目标对象唤醒目标区域内智能设备的语音指令。其中，这里的语音唤醒指令中可以但不限于包括：唤醒关键词。这里的唤醒关键词是提前设置并存储在唤醒指令处理模块中包含关键词的词组。在智能设备从当前检测到的语音唤醒指令中识别出关键词的情况下，则可以响应该语音唤醒指令，唤醒智能设备，以调整其的工作状态进入与用户进行交互的状态。

可选地，上述唤醒信息为第二语音设备基于所采集的信息处理后的信息。唤醒信息至少包括对于语音唤醒指令的识别结果和对目标对象的识别信息。其中，语音唤醒指令的识别结果可以但不限于是：将采集的语音唤醒指令的音频转换为文本信息。其中，唤醒信息中还可以但不限于包括：第二语音设备的设备标识。

可选地，唤醒信息中的识别信息是第二语音设备对目标对象的信息收集和判断。识别信息可以但不限于包括：触发语音唤醒指令的声源位置信息、语音唤醒指令的声源方位信息、语音唤醒指令的声源距离、人体红外检测结果、人体红外检测到对象的方位信息。

可选地，上述目标语音设备是第一语音设备基于唤醒信息进行信息比较判断后，从至少两个第二语音设备中选出的用于与目标对象交互的智能设备。目标语音设备与第一语音设备通过建立目标交互通道进行交互信息的双向传输。目标交互通道是不同于第一语音设备与第二语音设备建立的网络的独立交互通道。这里的目标交互通道可以但不限于是网络通道。

在本申请实施例中，采用第二语音设备采集目标对象的语音唤醒指令进行获取和处理并将处理结果发送给第一语音设备的方式，通过第一语音设备对至少两个第二语音设备分别发送的唤醒信息进行比对从而确定与目标对象交互的目标语音设备并建立目标交互通道，达到了在多个第二语音设备中确定目标语音设备完成与目标对象智能交互的目的，从而实现了从多个智能设备中确定出用于交互的智能设备的技术效果，进而解决了多个智能设备同时响应交互导致无法正常交互的技术问题。

作为一种可选的实施方式，在获取第一语音设备所关联的目标区域内的至少两个第二语音设备分别发送的唤醒信息之前，还包括：

构建第一语音设备和至少两个第二语音设备之间的网状通信网络，以使第一语音设备通过网状通信网络获取唤醒信息。

可选地，该网状通信网络可以但不限于是每个第二语音设备均与第一语音设备建立相互独立的通信通道。例如，网状通信网络可以但不限于是：blemesh网络。如基于blemesh网络建立第一语音设备与每一个第二语音设备之间的蓝牙控制信息传输通道。

在本申请实施例中，通过网状通信网络，每一个第二语音设备都将各自处理得到的唤醒信息发送给第一语音设备，使得第一语音设备能够基于唤醒信息进行判断，选择最合适的一个第二语音设备与用户交互。网状通信网络实现了第一语音设备与多个第二语音设备之间的唤醒信息和判断结果传输的通道，由此通过第一语音设备对多个第二语音设备基于用户的唤醒作出选择，避免多个第二语意设备同时应答导致无法正常交互，进而解决了多个智能设备同时响应交互导致无法正常交互的技术问题。

作为一种可选的实施方式，如图3所示，基于目标交互通道与目标语音设备进行音频信息的交互包括：

s302，接收目标语音设备发送的语音控制信息；

s304，将语音控制信息发送给服务器；

s306，获取服务器返回的与语音控制信息匹配的语音反馈结果；

s308，将语音反馈结果发送给语音控制信息对应的目标家居设备。

可选地，在本实施例中，上述语音控制信息是目标对象发出的交互指令所对应的信息。语音控制信息可以但不限于是经第二语音设备对交互指令处理后得到的音频信息、交互指令本身的音频信息。

可选地，在本实施例中，第二语音设备对于交互指令的处理可以但不限于是：降噪处理、过滤处理。

可选地，在本实施例中，上述目标交互通道可以但不限于是：基于蓝牙建立的音频传输通道。其中，目标交互通道可以但不限于是：双向a2dp连接。

上述语音控制信息通过目标交互通道发送给第一语音设备，第一语音设备通过网络将语音控制信息发给服务器进行识别、处理，得到语音反馈结果，第一语音设备将语音反馈结果发给目标家居设备。

可选地，在本实施例中，上述目标家居设备可以但不限于是目标区域内、智能家庭所包含的智能家居设备。例如，电视机、洗衣机、空调、音箱、照明设备、网关、新风设备等。其中，目标家居设备包含第二语音设备。

可选地，在本实施例中，上述语音反馈结果可以但不限于是：语音回复信息、请求控制的对象设备执行的目标操作。

作为一种可选的实施方式，将语音反馈结果发送给语音控制信息对应的目标家居设备包括：

在语音反馈结果指示播放与语音控制信息匹配的语音回复信息的情况下，将语音回复信息发送给目标语音设备，其中，目标家居设备包括目标语音设备；

在语音反馈结果指示对语音控制信息所请求控制的对象设备执行目标操作的情况下，将目标操作的操作指令发送给对象设备，其中，目标家居设备包括对象设备。

在本实施例中，在语音反馈结果指示为语音信息时，第一语音设备将对应的语音信息发给目标语音设备，由目标语音设备进行语音播放，完成与目标对象的语音交互。其中语音信息可以是对话回复、音乐、新闻等各种内容的音频信息。

在语音反馈结果指示为执行目标操作时，第一语音设备将对应的操作指令发送给对象设备，从而使对象设备按照操作指令执行目标操作，从而完成目标对象的交互目的。

可选地，如图4所示，第一语音设备在接收到语音反馈结果后，对于语音反馈结果的类型进行判断。第一语音设备对接收到的语音反馈结果执行步骤s402，判断语音反馈结果是否包括语音回复信息，判断结果为是，则执行步骤s404，将语音回复信息发送给目标语音设备；判断结果为否，则执行步骤s406，将目标操作的操作指令发送给对象设备。

在本申请实施例中，目标语音设备基于目标交互通道与第一语音设备进行音频传输，从而使得第一语音设备能够接收目标对象的交互语音指令，并基于服务器处理后的语音反馈结果，确定接收语音反馈结果的家居设备，从此完成目标对象对于智能家庭的交互控制。第一语音设备作为目标对象的交互接收和结果反馈的唯一设备，避免了多个智能设备同时响应目标对象的交互指令，从而避免多个智能交互同时响应造成的交互异常的问题。

作为一种可选的实施方式，如图5所示，比对至少两个第二语音设备各自的唤醒信息，得到比对结果包括：

s502，在识别结果中提取唤醒关键词；

s504，将在识别结果中提取出有唤醒关键词的第二语音设备，作为候选语音设备；

s506，从候选语音设备的识别信息中，获取候选语音设备与目标对象之间的距离；

s508，比对距离，以获取距离最小值；

s510，将距离最小值对应的候选语音设备，确定为目标语音设备。

可选地，唤醒信息中至少包括语音唤醒指令的识别结果和指示第二语音设备与目标对象之间的距离信息的识别信息。

可选地，第二语音设备对于语音唤醒指令的识别可以但不限于使用语音识别模块，其中，语音识别模块可以但不限于是离线语音识别模块。可选地，第二语音设备中的语音识别模块可以但不限于用于将语音唤醒指令转换为文本信息。

可选地，第二语音设备在检测到目标对象的语音唤醒指令后，基于语音唤醒指令，利用语音识别模块对语音的声源位置进行判断，从而得出目标对象发出语音唤醒指令时与第二语音设备之间的距离。

可选地，第二语音设备在检测到目标对象的语音唤醒指令后，基于语音唤醒指令，利用语音识别模块对语音的声源方向进行判断，从而得出目标对象发出语音唤醒指令时与第二语音设备之间的相对方向信息。

可选地，上述相对方向信息可以但不限于是：在多个预选方向中选出最接近的方向信息。

可选地，第一语音设备在多份唤醒信息中，首先排除在识别结果中未能成功提取出唤醒关键词的第二语音设备，将提取出唤醒关键词的第二语音设备作为候选语音设备，比对候选语音设备的识别信息中指示与目标对象之间距离的信息即语音唤醒指令与第二语音设备之间的距离信息，从中挑选出距离值最小所对应的第二语音设备作为目标语音设备。

作为一种可选的实施方式，在识别结果中提取出唤醒关键词的第二语音设备，作为候选语音设备之后，还包括：

在部分候选语音设备的识别信息中的红外识别结果指示检测到对象的情况下，判断对象的方位与语音唤醒指令的方位；

在对象的方位与语音唤醒指令的方位一致的情况下，获取部分候选语音设备各自与目标对象之间的距离。

可选地，识别信息中至少还包括语音唤醒指令的方位信息、指示红外识别是否检测到对象的结果、检测到对象的方位信息。

可选地，语音唤醒指令的方位信息可以但不限于是语音采集模块在采集语音唤醒指令时根据语音唤醒指令所在的相对于第二语音设备的位置信息得到的。

可选地，第二语音设备可以但不限于包括红外检测模块，用于检测目标区域内是否存在对象。红外检测模块检测到目标区域内存在对象，则将存在对象的检测结果写入识别信息中，同时将检测到的对象相应的方位信息写入识别信息中。在红外检测模块为检测到目标区域内不存在对象，则将不存在对象的检测结果写入识别信息中。

可选地，在唤醒信息中包含语音唤醒指令的识别结果和识别信息。识别信息中至少包括语音唤醒指令的距离信息、方位信息和红外检测的检测信息。其中红外检测的检测信息至少包括在检测区域内是否检测到对象以及对象的方位信息。

可选地，在检测结果中包含唤醒关键词词识别结果、与目标对象之间距离、红外检测结果的情况下，第一语音设备从多个第二语音设备中确定目标语音设备的判断流程可以如图6所示。第一语音设备在接收到至少两份唤醒信息的情况下，执行步骤s602，判断语音唤醒指令中是否提取出唤醒关键词，在识别结果为是，即语音唤醒指令中包含有唤醒关键词的情况下，执行步骤s604，挑选为候选唤醒信息，即将提取出唤醒关键词的唤醒信息作为候选唤醒信息。继而执行步骤s606，判断候选唤醒信息中红外检测结果是否满足要求。对于红外检测结果的要求是：红外检测结果检测到对象且对象的方位与语音唤醒指令的方位一致。在方位信息一致的情况下，判定红外检测结果检测的对象即为目标对象，红外检测结果满足要求。红外检测结果检测到对象，但对象的方位信息与语音唤醒指令的方位信息不一致或红外检测结果没有检测到对象均为不满足要求。

在结果为是，即在多份唤醒信息中存在红外检测结果检测满足要求的唤醒信息，则执行步骤s608，比对唤醒信息中的距离值，将距离值最小的唤醒信息对应的第二语音设备确定为目标语音设备。即在红外检测结果满足要求的唤醒信息中比对声源距离值，将声源距离值最小对应的第二语音设备确定为目标语音设备。若在候选唤醒信息中不存在红外检测结果满足要求的唤醒信息，则执行步骤s610，比对全部候选唤醒信息中的距离值，将距离值最小的唤醒信息对应的第二语音设备确定为目标语音设备。若语音唤醒指令中没有提取出唤醒关键词，至执行步骤s612，停止对相应唤醒信息的判断，即没有提取出唤醒关键词的第二语音设备不作为目标语音设备的候选语音设备。

在本申请实施例中，第一语音设备通过对唤醒信息中包含的唤醒关键词识别结果、红外检测结果、声源距离进行相应的判断，由此在至少两个第二语音设备中选出与目标对象交互的目标语音设备，确定了与目标对象交互的语音设备，解决了多个语音设备同时和目标对象交互，导致无法正常交互的问题。

根据本发明实施例的又一个方面，提供了一种智能设备交互方法，作为一种可选的实施方式，如图7所示，上述智能设备交互方法包括：

s702，获取唤醒信息，其中，唤醒信息中至少携带有第二语音设备对目标区域内的目标对象的语音唤醒指令的识别结果以及第二语音设备对目标对象的识别信息，第二语音设备中包括用于采集语音信号的语音采集模块；

s704，将唤醒信息发送给第一语音设备，以使第一语音设备比对至少两个第二语音设备各自的唤醒信息，选出目标语音设备，其中，第一语音设备中包括用于采集语音信号的语音采集模块；

s706，在被确定为目标语音设备的情况下，建立与第一语音设备之间的目标交互通道；

s708，基于目标交互通道与第一语音设备进行音频信息的交互。

可选地，在本实施例中，上述智能设备交互方法可以但不限于应用于目标区域内多个语音设备的交互过程中，其中，多个语音设备可以包括但不限于：主语音设备和从语音设备。这里智能设备交互方法可以但不限于应用于从语音设备，如第一语音设备为主语音设备，第二语音设备为从语音设备。此外，上述目标区域可以但不限于是第一语音设备与第二语音设备所在的区域。如第一语音设备所在的智能家庭的覆盖区域。

上述第二语音设备是带有语音采集模块的智能语音设备，其中，第一语音设备关联有至少两个第二语音设备。第一语音设备基于第二语音设备发送的唤醒信息，通过比对多份唤醒信息，从而确定与目标对象交互的目标语音设备。

具体实施例可以参考上述方法实施例，这里不再赘述。

在本申请实施例中，采用第二语音设备采集目标对象的语音唤醒指令进行处理并将处理结果发送给第一语音设备的方式，通过第一语音设备对至少两个第二语音设备分别发送的唤醒信息进行比对从而确定与目标对象交互的目标语音设备并建立目标交互通道，达到了在多个第二语音设备中确定目标语音设备完成与目标对象智能交互的目的，从而实现了从多个智能设备中确定出用于交互的智能设备的技术效果，进而解决了多个智能设备同时响应交互导致无法正常交互的技术问题。

作为一种可选的实施方式，获取唤醒信息包括：

通过语音采集模块采集当前区域内的语音唤醒指令；

识别所述语音唤醒指令，并将语音唤醒指令的识别结果添加到唤醒信息中。

需要说明的是，上述语音采集模块会检测目标范围内的声源信息，在目标对象发出语音唤醒指令后，语音采集模块采集到语音唤醒指令对应的音频，并将音频信息进行识别转换并将识别结果添加在唤醒信息中。

可选地，语音唤醒指令的识别结果可以但不限于是：将语音唤醒指令的音频转化为文本信息。

上述唤醒关键词是预设的对于唤醒第一语音设备和第二语音设备的固定词语的词组，通常存储在对于语音唤醒指令进行识别处理的模块中。在本实施例中，唤醒关键词存储在第二语音设备的语音识别模块中。第二语音设备只有在检测到的音频流中识别出唤醒关键词，才会判定为目标对象想要唤醒第二语音设备进行交互。

具体实施例可以参考上述方法实施例，这里不再赘述。

作为一种可选的实施方式，获取唤醒信息包括：

获取触发语音唤醒指令的目标对象所在位置到第二语音设备之间的距离；

将距离添加到唤醒信息的识别信息中。

作为一种可选的实施方式，获取唤醒信息包括：

通过红外识别模块检测当前区域内的对象，得到红外识别结果；

将红外识别结果添加到唤醒信息的识别信息中。

可选地，在本实施例中，唤醒信息的识别信息中至少还包括目标对象与第二语音设备之间的距离和第二语音设备的红外检测结果。

可选地，识别信息可以但不限于包括：语音唤醒指令发出的距离信息、方位信息和红外检测结果。

可选地，红外检测结果可以但不限于包括：是否检测到对象、对象的方位信息。

需要说明的是，第二语音设备中的语音采集识别模块具备声源距离以及声源方位的识别功能。语音采集模块在检测在目标对象发出的唤醒指令的同时，会确定目标对象发出唤醒指令时与第二语音设备之间的距离以及唤醒指令相对于第二语音设备的方位信息，从而将处理得到的目标对象与第二语音设备之间的距离和方位信息添加至识别信息中。

在本申请实施例中，第二语音设备将语音唤醒指令识别结果、声源距离、声源方位、红外检测结果添加至唤醒信息并发送给第一语音设备，第一语音设备基于唤醒信息，优先选择识别出唤醒关键词的第二语音设备，在多个第二语音设备均识别出唤醒关键词的情况下，选择声源较近的第二语音设备，且在有第二语音设备的红外检测识别满足要求的情况下，优先选择红外识别满足要求的第二语音设备，从而在多个均能够与目标对象交互的第二语音设备中确定与目标对象交互的目标语音设备，从而通过目标语音设备与目标对象交互，避免了多个语音设备同时响应交互而造成的无法正常交互的问题。

作为一种可选的实施方式，在获取唤醒信息之前，还包括：

构建第一语音设备和至少两个语音设备之间的网状通信网络，以通过网状通信网络发送唤醒信息。

上述网状通信网络是第一语音设备和第二语音设备之间传输唤醒信息和控制指令的通信通道。

具体实施例可以参考上述方法实施例，这里不再赘述。

作为一种可选的实施方式，如图8所示，基于目标交互通道与第一语音设备进行音频信息的交互包括：

s802，获取语音控制信息；

s804，将语音控制信息发送给第一语音设备；

s806，接收第一语音设备发送的与语音控制信息匹配的语音反馈结果；

s808，在语音反馈结果指示播放与语音控制信息匹配的语音回复信息的情况下，接收并播放语音回复信息。

在本申请实施例中，第二语音设备基于目标交互通道与第一语音设备进行音频交互，使第二语音设备将语音回复信息播放给目标对象，完成与目标对象的语音交互。

可选地，第一语音设备与多个第二语音设备之间建立的通信网络以及与目标语音设备建立目标交互通道的架构可以如图9所示。这里主音箱901为第一语音设备，从音箱9031、从音箱9032、从音箱9033、从音箱9034、从音箱9035为第二语音设备，在此对连接的第二语音设备即从音箱的的数量不做限制，五个仅为示例。主音箱901与从音箱9031、从音箱9032、从音箱9033、从音箱9034、从音箱9035基于蓝牙连接，建立blemesh通信网络905，即用以传输唤醒信息的通信通道，如图中实线所示。主音箱901与五个从音箱之间的通信通道相互独立。从音箱9031、从音箱9032、从音箱9033、从音箱9034、从音箱9035通过各自的通信通道将唤醒信息传输给主音箱901，主音箱901通过对五份唤醒信息进行比较判断后，确定从音箱9035对应的唤醒信息中识别出唤醒关键词且从音箱9035与目标对象之间的距离值最小，因此确定从音箱9035为目标语音设备，则主音箱901建立与从音箱9035之间的a2dp双向音频传输通道907，如图中虚线所示，用于传输从音箱五9035采集到的目标对象的音频流。

可选地，第一语音设备与第二语音设备的交互时序如图10所示。第一语音设备以主音箱1030为例，第二语音设备以从音箱一1042、从音箱二1044、从音箱三1046为例。用户1010在家庭网络的覆盖区域内发起步骤s1001发出语音唤醒指令。从音箱一1042、从音箱二1044、从音箱三1046的语音采集模块均采集到该语音唤醒指令，则从音箱一1042、从音箱二1044、从音箱三1046各自独立执行步骤s1003处理语音唤醒指令，处理语音唤醒指令得到转换后的文本信息、获得声源位置、声源方位，以及通过红外检测获取检测结果，其中检测结果包括是否检测到对象以及检测到的对象的方位信息。根据处理结果，各自独立执行步骤s1005生成唤醒信息，将唤醒关键词识别结果、声源距离、红外检测结果均添加在唤醒信息中，并通过blemesh网络执行步骤s1007发送唤醒信息给主音箱1030。主音箱1030接收到三份唤醒信息，执行步骤s1009比对唤醒信息，选择从音箱一。主音箱1030通过对三份唤醒信息的比对，从音箱一1042既在识别结果中提取出唤醒关键词，同时红外识别出对象且对象的方位信息与声源方位信息一致，声源距离数值最小，因此从音箱一1042被确定为目标交互音箱，主音箱1030通过blemesh网络执行步骤s1031通知从音箱一，从而执行步骤s1013建立a2dp连接，以使从音箱一1042与主音箱1030之间建立双向音频流传输通道。

此时，主音箱1030和从音箱一1042唤醒成功，从音箱二1044、从音箱三1046未被唤醒。用户1010执行步骤s1015发出交互指令。从音箱一1042获取交互指令，并执行步骤s1017传输交互音频给从音箱1030，从音箱1030接收从音箱一基于a2dp通道传输的交互音频，执行步骤s1019发送交互音频给服务器1020，以使服务器1020对交互音频进行处理，得到处理结果，服务器1020执行步骤s1021返回处理结果给主音箱1030。设定此处理结果为音频结果，例如聊天回应、用户想要播放的音乐。新闻。主音箱1030执行步骤s1023传输结果音频给从音箱一1042，从音箱一1042接收到结果音频后执行步骤s1025播放结果音频，完成用户1010与主音箱1030的智能交互。

根据本发明实施例的另一个方面，还提供了一种用于实施上述智能设备交互方法的智能设备交互装置。如图11所示，该装置包括：

获取模块1102，用于获取第一语音设备所关联的目标区域内的至少两个第二语音设备分别发送的唤醒信息，其中，唤醒信息中至少携带有第二语音设备对目标区域内的目标对象的语音唤醒指令的识别结果以及第二语音设备对目标对象的识别信息，第一语音设备与第二语音设备中分别包括用于采集语音信号的语音采集模块；

比对模块1104，用于比对至少两个第二语音设备各自的唤醒信息，得到比对结果；

确定模块1106，用于根据比对结果从至少两个第二语音设备中选出目标语音设备；

建立模块1108，用于建立与目标语音设备之间的目标交互通道；

交互模块1110，用于基于目标交互通道与目标语音设备进行音频信息的交互。

根据本发明实施例的另一个方面，还提供了一种用于实施上述智能设备交互方法的智能设备交互装置。如图12所示，该装置包括：

获取模块1202，用于获取唤醒信息，其中，唤醒信息中至少携带有第二语音设备对目标区域内的目标对象的语音唤醒指令的识别结果以及第二语音设备对目标对象的识别信息，第二语音设备中包括用于采集语音信号的语音采集模块；

发送模块1204，用于将唤醒信息发送给第一语音设备，以使第一语音设备比对至少两个第二语音设备各自的唤醒信息，选出目标语音设备，其中，第一语音设备中包括用于采集语音信号的语音采集模块；

建立模块1206，用于在被确定为目标语音设备的情况下，建立与第一语音设备之间的目标交互通道；

交互模块1208，用于基于目标交互通道与第一语音设备进行音频信息的交互。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

根据本申请的又一方面，如图13所示，提供了一种智能设备交互系统，包括：

至少两个第二语音设备1302，用于获取唤醒信息；

第一语音设备1304，用于比对至少两个第二语音设备发送的唤醒信息，根据比对结果选出目标语音设备，并建立与目标语音设备交互的目标交互通道，通过目标交互通道获取语音控制信息；

服务器1306，用于处理第一语音设备发送的语音控制信息，以得到语音反馈结果，并将语音反馈结果发送给第一语音设备和第二语音设备。

在本申请实施例中，采用第二语音设备采集目标对象的语音唤醒指令进行处理并将处理结果以唤醒信息的方式发送给第一语音设备，通过第一语音设备对至少两个第二语音设备分别发送的唤醒信息进行比对从而确定与目标对象交互的目标语音设备并建立目标交互通道，达到了在多个第二语音设备中确定目标语音设备完成与目标对象智能交互的目的，从而实现了从多个智能设备中确定出用于交互的智能设备的技术效果，进而解决了多个智能设备同时响应交互导致无法正常交互的技术问题。

根据本申请的又一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述智能设备交互方法的各种可选实现方式中提供的方法。其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序：

s1，获取第一语音设备所关联的目标区域内的至少两个第二语音设备分别发送的唤醒信息，其中，唤醒信息中至少携带有第二语音设备对目标区域内的目标对象的语音唤醒指令的识别结果以及第二语音设备对目标对象的识别信息，第一语音设备与第二语音设备中分别包括用于采集语音信号的语音采集模块；

s2，比对至少两个第二语音设备各自的唤醒信息，得到比对结果；

s3，根据比对结果从至少两个第二语音设备中选出目标语音设备，并建立与目标语音设备之间的目标交互通道；

s4，基于目标交互通道与目标语音设备进行音频信息的交互。

上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序：

s1，获取唤醒信息，其中，唤醒信息中至少携带有第二语音设备对目标区域内的目标对象的语音唤醒指令的识别结果以及第二语音设备对目标对象的识别信息，第二语音设备中包括用于采集语音信号的语音采集模块；

s2，将唤醒信息发送给第一语音设备，以使第一语音设备比对至少两个第二语音设备各自的唤醒信息，选出目标语音设备，其中，第一语音设备中包括用于采集语音信号的语音采集模块；

s3，在被确定为目标语音设备的情况下，建立与第一语音设备之间的目标交互通道；

s4，基于目标交互通道与第一语音设备进行音频信息的交互。

可选地，在本实施例中，本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(read-onlymemory，rom)、随机存取器(randomaccessmemory，ram)、磁盘或光盘等。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除