语音响应方法、装置、设备以及存储介质与流程
本公开涉及语音交互领域,尤其涉及一种语音响应方法、装置、设备以及计算机可读存储介质。
背景技术:
随着技术的发展和生活的进步,人们越来越倾向于使用各种智能穿戴设备来提高自身的生活质量。现有的智能穿戴设备支持语音交互的功能,通过语音交互方式,可以实现信息查询功能、智能家居控制功能或者其他的个性化操作。在相关的语音交互场景中,用户通常可以在任意场景下对智能穿戴设备进行语音输入,以期待该智能穿戴设备的响应结果;然而,现有智能穿戴设备的语音响应方案具有一定局限,响应准确率不高,有时用户输入的语音信号无法让智能穿戴设备明确用户的具体意图,从而无法给出用户想要的响应结果。
技术实现要素:
为克服相关技术中存在的问题,本公开提供了一种语音响应方法、装置、设备及计算机可读存储介质。
根据本公开实施例的第一方面,提供一种语音响应方法,包括:
基于采集的语音信号,获取识别所述语音信号得到的语音信息;
获取与所述语音信息相应的一条或多条响应参数;所述响应参数包括待响应的应用和/或待响应的应用页面、以及对应的响应指令;
若当前运行的应用为所述待响应的应用和/或当前显示的应用页面为所述待响应的应用页面,执行所述响应指令。
可选地,所述响应参数还包括响应触发方式;
所述执行所述响应指令,包括:
基于所述响应触发方式触发所述当前运行的应用执行所述响应指令。
可选地,所述语音响应方法应用于智能穿戴设备;
所述基于采集的语音信号,获取识别所述语音信号得到的语音信息,包括:
将采集的所述语音信号发送给云端;所述语音信号用于触发所述云端识别所述语音信号得到语音信息,并基于所述语音信息匹配预置的意图关键词,以获取与所述意图关键词对应的一条或多条响应参数并返回给所述智能穿戴设备;所述意图关键词表示所述语音信息可能执行的操作;
所述获取与所述语音信息相应的一条或多条响应参数,包括:
接收所述云端发送的与所述意图关键词对应的一条或多条响应参数。
可选地,所述语音响应方法应用于智能穿戴设备;
所述基于采集的语音信号,获取识别所述语音信号得到的语音信息,包括:
将采集的语音信号发送给云端,以从云端获取识别所述语音信号得到的语音信息;
所述获取与所述语音信息相应的一条或多条响应参数,若当前运行的应用为所述待响应的应用、和/或当前显示的应用页面为所述待响应的应用页面,执行所述响应指令,包括:
获取当前运行的应用和/或当前显示的应用页面对应的响应参数;所述响应参数还包括一条或多条预置文本信息;
匹配所述文本信息与所述语音信息,若所述语音信息匹配所述预置文本信息,执行所述预置文本信息对应的响应指令。
可选地,所述语音响应方法应用于云端;
所述基于采集的语音信号,获取识别所述语音信号得到的语音信息,包括:
接收智能穿戴设备发送的语音信号,识别所述语音信号得到的语音信息;
所述获取与所述语音信息相应的一条或多条响应参数,包括:
基于所述语音信息匹配预置的意图关键词,以获取与所述意图关键词对应的一条或多条响应参数;所述意图关键词表示所述语音信息可能执行的操作;
所述若当前运行的应用为所述待响应的应用、和/或当前显示的应用页面为所述待响应的应用页面,执行所述响应指令,包括:
接收所述智能穿戴设备发送的当前运行的应用和/或当前显示的应用页面;
若所述当前运行的应用为所述待响应的应用和/或所述当前显示的应用页面为所述待响应的应用页面,将所述响应指令发送给所述智能穿戴设备,以使所述智能穿戴设备执行所述响应指令。
可选地,所述语音响应方法应用于移动终端;所述移动终端与智能穿戴设备关联;
所述基于采集的语音信号,获取识别所述语音信号得到的语音信息,包括:
接收云端发送的语音信息;所述语音信息为关联的智能穿戴设备将采集的语音信号发送给云端之后,由所述云端识别所述语音信号得到的;
所述获取与所述语音信息相应的一条或多条响应参数,包括:
接收所述云端发送的与所述语音信息相应的一条或多条响应参数;所述响应参数为所述云端基于所述语音信息匹配预置的意图关键词,获取与所述意图关键词对应的一条或多条响应参数并返回的;
所述若当前运行的应用为所述待响应的应用、和/或当前显示的应用页面为所述待响应的应用页面,执行所述响应指令包括:
接收所述智能穿戴设备发送的当前运行的应用和/或当前显示的应用页面;
若当前运行的应用为所述待响应的应用、和/或当前显示的应用页面为所述待响应的应用页面,将所述响应指令发送给所述智能穿戴设备,以使所述智能穿戴设备执行所述响应指令。
可选地,所述智能穿戴设备包括声音采集单元;
所述语音信号为所述智能穿戴设备响应于用户的唤醒操作,启动所述声音采集单元采集得到的。
可选地,所述智能穿戴设备还包括惯性传感器;
所述唤醒操作包括指定控件的触发操作或者基于所述惯性传感器采集的数据确定的用户的指定动作。
根据本公开实施例的第二方面,提供一种语音响应装置,包括:
语音信息获取模块,被配置为基于采集的语音信号,获取识别所述语音信号得到的语音信息;
响应参数获取模块,被配置为获取与所述语音信息相应的响应参数;所述响应参数包括待响应的应用和/或待响应的应用页面、以及对应的响应指令;
响应指令执行模块,被配置为若当前运行的应用为所述待响应的应用、和/或当前显示的应用页面为所述待响应的应用页面,执行所述响应指令。
可选地,所述响应参数还包括响应触发方式;
所述响应指令执行模块被配置为:
若当前运行的应用为所述待响应的应用、和/或当前显示的应用页面为所述待响应的应用页面,基于所述响应触发方式触发所述当前运行的应用执行所述响应指令。
可选地,所述语音响应方法应用于智能穿戴设备;
所述语音信息获取模块被配置为:
将采集的所述语音信号发送给云端;所述语音信号用于触发所述云端识别所述语音信号得到语音信息,并基于所述语音信息匹配预置的意图关键词,以获取与所述意图关键词对应的一条或多条响应参数并返回给所述智能穿戴设备;所述意图关键词表示所述语音信息的可能执行的操作;
所述响应参数获取模块被配置为:
接收所述云端发送的与所述意图关键词对应的一条或多条响应参数。
可选地,所述语音响应方法应用于智能穿戴设备;
所述语音信息获取模块,被配置为:
将采集的语音信号发送给云端,以从云端获取识别所述语音信号得到的语音信息;
所述响应参数获取模块以及所述响应指令执行模块,被配置为:
获取当前运行的应用和/或当前显示的应用页面对应的响应参数;所述响应参数还包括一条或多条预置文本信息;
匹配所述文本信息与所述语音信息,若所述语音信息匹配所述预置文本信息,执行所述预置文本信息对应的响应指令。
可选地,所述语音响应方法应用于云端;
所述语音信息获取模块被配置为:
接收智能穿戴设备发送的语音信号,识别所述语音信号得到的语音信息;
所述响应参数获取模块包括:
基于所述语音信息匹配预置的意图关键词,以获取与所述意图关键词对应的一条或多条响应参数;所述意图关键词表示所述语音信息的可能执行的操作;
所述响应指令执行模块被配置为:
应用和/或应用页面接收子模块,被配置为接收所述智能穿戴设备发送的当前运行的应用和/或当前显示的应用页面;
响应指令发送子模块,被配置为若所述当前运行的应用为所述待响应的应用、和/或所述当前显示的应用页面为所述待响应的应用页面,将所述响应指令发送给所述智能穿戴设备,以使所述智能穿戴设备执行所述响应指令。
可选地,所述语音响应方法应用于移动终端;所述移动终端与智能穿戴设备关联;
所述语音信息获取模块被配置为:
接收云端发送的语音信息;所述语音信息为关联的智能穿戴设备将采集的语音信号发送给云端之后,由所述云端识别所述语音信号得到的;
所述响应参数获取模块被配置为:
接收所述云端发送的与所述语音信息相应的一条或多条响应参数;所述响应参数为所述云端基于所述语音信息匹配预置的意图关键词,获取与所述意图关键词对应的一条或多条响应参数并返回的;
所述响应指令执行模块被配置为:
应用和/或应用页面接收子模块,被配置为接收所述智能穿戴设备发送的当前运行的应用和/或当前显示的应用页面;
响应指令发送子模块,被配置为若当前运行的应用为所述待响应的应用、和/或当前显示的应用页面为所述待响应的应用页面,将所述响应指令发送给所述智能穿戴设备,以使所述智能穿戴设备执行所述响应指令。
可选地,所述智能穿戴设备包括声音采集单元;
所述语音信号为所述智能穿戴设备响应于用户的唤醒操作,启动所述声音采集单元采集得到的。
可选地,所述智能穿戴设备包括惯性传感器;
所述唤醒操作包括指定控件的触发操作或者基于所述惯性传感器采集的数据确定的用户的指定动作。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,
所述处理器被配置为执行如上所述方法中的操作。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,当由一个或多个处理器执行时,使得处理器执行如上所述方法中的操作。
本公开的实施例提供的技术方案可以包括以下有益效果:
本公开中,在采集到用户的语音信号之后,首先获取识别所述语音信号的语音信息,再获取与所述语音信息相应的响应参数,所述响应参数包括待响应的应用和/或待响应的应用页面、以及对应的响应指令,从而如果检测到当前运行的应用为所述待响应的应用、和/或当前显示的应用页面为所述待响应的应用页面,执行所述响应指令,本公开实施例能够根据应用确定用户语音的意图,并基于用户的语音执行应用的响应指令,给出用户想要的响应结果,实现通过语音来控制应用的具体功能,提高用户的使用体验。
本公开中,所述语音响应方法可以应用于智能穿戴设备中,所述智能穿戴设备将采集的所述语音信号发送给云端,以从云端获取响应参数,通过所述响应参数,所述智能穿戴设备可以根据应用来明确用户的语音意图,并根据用户的语音意图执行应用内的可响应指令,实现通过语音来控制应用的具体功能,提高用户的使用体验;同时,由于只需将相关的响应参数存储在云端,云端将匹配的响应参数发送给所述智能穿戴设备即可,无需对云端进行任何改进,因此可以适用于各种厂商的云端,具备良好的兼容性。
本公开中,所述智能穿戴设备包括声音采集单元以及惯性传感器,能够响应于用户的唤醒操作,启动所述语音采集单元以采集语音信号,所述唤醒操作包括指定控件的触发操作或者基于所述惯性传感器采集的数据确定的用户的指定动作,实现在用户需要时才启动语音采集单元,从而节省所述智能穿戴设备的电量,避免维持语音采集单元的持续运行导致所述智能穿戴设备的续航时长大幅度缩小。
本公开中,所述语音响应方法可以应用于智能穿戴设备中,所述智能穿戴设备将采集的所述语音信号发送给云端,以从云端获取识别所述语音信号得到的语音信息,所述智能穿戴设备将识别得到的语音信息与当前运行的应用和/或当前显示的应用页面对应的预置文本信息进行匹配,如果匹配,表明命中用户的语音意图,则所述智能穿戴设备执行所述预置文本信息对应的响应指令,以实现通过语音控制应用的具体功能,提高用户的使用体验。
本公开中,所述语音响应方法可以应用于云端中,所述云端接收并识别智能穿戴设备发送的语音信号以得到语音信息,然后基于所述语音信息匹配预置的意图关键词,以获取所述意图关键词对应的响应参数,并在接收到所述智能穿戴设备发送的当前显示的应用和/或应用页面之后,检测所述当前运行的应用是否匹配待响应的应用、和/或所述当前显示的应用页面是否匹配待响应的应用页面,若匹配,表明命中用户的语音意图,则所述云端将对应的响应指令发送给所述智能穿戴设备,以使所述智能穿戴设备执行所述待响应位置对应的响应指令,通过对云端进行改进,使得云端可以基于应用明确用户的语音意图,实现通过语音控制应用的具体功能,提高用户的使用体验。
本公开中,所述语音响应方法可以应用于与智能穿戴设备关联的移动终端中,所述移动终端接收云端返回的语音信息以及与语音消息相应的一条或多条响应参数,然后接收所述智能穿戴设备发送的当前运行的应用和/或当前显示的应用页面之后,检测所述当前运行的应用是否匹配待响应的应用、和/或所述当前显示的应用页面是否匹配待响应的应用页面,若匹配,表明命中用户的语音意图,则所述移动终端将对应的响应指令发送给所述智能穿戴设备,以使所述智能穿戴设备执行所述响应指令,通过对移动终端进行改进,使得移动终端可以根据应用明确用户的语音意图,实现通过语音控制应用的具体功能,提高用户的使用体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本公开根据一示例性实施例示出的一种语音响应方法的流程图。
图2是本公开根据一示例性实施例示出的第二种语音响应方法的流程图。
图3是本公开根据一示例性实施例示出的第三种语音响应方法的流程图。
图4是本公开根据一示例性实施例示出的第四种语音响应方法的流程图。
图5是本公开根据一示例性实施例示出的一种语音响应装置的结构框图。
图6是本公开根据一示例性实施例示出的一种电子设备的架构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
相关技术中的智能穿戴设备或移动终端支持语音交互的功能,通过语音交互方式,可以实现信息查询功能、智能家居控制功能或者其他的个性化操作。在相关的语音交互场景中,用户通常可以在任意场景下对智能穿戴设备或移动终端进行语音输入,以期待该智能穿戴设备或该移动终端的响应结果,由于智能穿戴设备与移动终端实现语音交互方式相同,以下以智能穿戴设备为例进行说明,相关技术中的实现手段是:所述智能穿戴设备采集用户的语音信号,然后将采集的语音信号发送给云端,云端对所述语音信号进行识别以获取语音识别结果(即语音信息),然后基于所述语音识别结果确定用户的意图,从而确定相应的功能,从而执行相应的功能并返回响应结果给所述智能穿戴设备,比如用户在智能穿戴设备处输入“今天天气怎么样”的语音信号,所述云端识别该语音信号明确用户想知道天气情况,并执行查询天气的功能,从而返回天气结果给所述智能穿戴设备,但是,有时用户输入的语音信号无法让智能穿戴设备明确用户的具体意图,比如用户在智能穿戴设备处输入“保存”的语音信号,所述智能穿戴设备或者所述云端无法从该语音信息中明确用户的具体意图,从而无法给出用户想要的响应结果,用户体验不佳。
因此,为了解决相关技术中的问题,本公开实施例提供了一种语音响应方法;所述语音响应方法能够根据当前运行的应用明确用户输入的语音信号的意图,从而获取用户想要的响应结果,也实现了通过语音控制应用中的具体功能。
请参阅图1,图1是本公开根据一示例性实施例示出的一种语音响应方法的流程图,所述语音响应方法可以由智能穿戴设备或者移动终端来执行,以下以所述语音响应方法由智能穿戴设备执行为例进行说明:所述智能穿戴设备可以是手环、手表、手带、指环、臂带或者脚环等设备,所述方法包括:
在步骤s101中,基于采集的语音信号,获取识别所述语音信号得到的语音信息。
在步骤s102中,获取与所述语音信息相应的一条或多条响应参数;所述响应参数包括待响应的应用和/或待响应的应用页面、以及对应的响应指令。
在步骤s103中,若当前运行的应用为所述待响应的应用和/或当前显示的应用页面为所述待响应的应用页面,执行所述响应指令。
需要说明的是,所述智能穿戴设备包括声音采集单元,所述声音采集单元用于采集用户的语音信号,所述声音采集单元可以是麦克风、拾音器等设备。
在一种可能的实现方式中,所述智能穿戴设备可以在检测到用户的唤醒操作时,响应于用户的唤醒操作,启动所述语音采集单元以采集语音信号,作为例子,所述唤醒操作可以是指定控件(可以是虚拟控件也可以是实体按键)被触发的操作,或者在包括有惯性传感器(加速度传感器或者陀螺仪等)的智能穿戴设备中,可以通过检测所述惯性传感器的数据确定用户的指定动作,比如当所述智能穿戴设备为手表或者手环时,所述指定动作可以是抬腕动作,然后所述智能穿戴设备基于检测到的抬腕动作启动所述语音采集单元,智能判断的过程解放用户的双手,提高用户的使用体验;同时,本公开实施例在用户需要时才启动语音采集单元,从而节省所述智能穿戴设备的电量,避免维持语音采集单元的持续运行导致所述智能穿戴设备的续航时长大幅度缩小。
需要说明的是,本申请对于所述声音采集单元的启动时机不做任何限制,所述智能穿戴设备可以在打开任何应用的情况下,响应于用户的唤醒操作启动所述声音采集单元;并且,所述声音采集单元的启动与当前打开的应用为相互独立的两个功能。
在一实施例中,预先在云端配置意图关键词以及意图关键词对应的一条或多条响应参数,所述意图关键词表示所述语音消息语音信息可能执行的操作,比如接收到“我要回复短信”、“发短信”、“发送短信”等语音信号,其对应的意图关键词可以是“短信回复”,表示用户要进行短信回复的操作;另外,所述响应参数可以包括以下内容:
在第一种可能的实现方式中,所述响应参数可以包括待响应的应用、响应触发方式以及对应的响应指令;所述响应触发方式表示执行所述响应指令的触发操作;在一个例子中,所述响应触发方式包括控件(虚拟按键或者实体控件)以及触发该控件的操作;比如意图关键词为“短信回复”,对应的响应参数包括短信应用、“回复”控件、触发该控件的操作以及回复指令;再如意图关键词为“保存”,可能对应多条响应参数,比如其中一条响应参数可以包括运动应用、“保存”控件、触发该控件的操作以及保存运动数据的保存指令,另一条响应参数可以包括电话应用、“保存”控件、触发该控件的操作以及保存电话号码的保存指令。
在第二种可能的实现方式中,所述响应参数可以包括待响应的应用页面、响应触发方式以及对应的响应指令;其中,所述应用页面表示应用向用户展示的应用的ui界面,比如短信回复页面。
在第三种可能的实现方式中,所述响应参数可以包括待响应的应用、待响应的应用页面、响应触发方式以及对应的响应指令;以意图关键词为“语音回复”为例,以下是两条响应参数的形式的示例性说明:
{"packagename":"com.huami.wear.notification",
"appaction":"com.huami.wear.notification.action_message",
"action":"voice_reply"}
或者
{"packagename":"com.huami.wear.message",
"appaction":"com.huami.wear.message.action_details",
"action":"voice_reply"}
其中,所述packagename表示待响应的应用,所述appaction表示待响应的应用页面,所述action表示响应触发方式以及对应的响应指令,即如何触发响应指令去执行。
可以看出,本公开实施例中无需对云端进行任何改进,只需将已经配置好的意图关键词以及意图关键词对应的响应参数的相关数据存到云端。
在本公开实施例中,所述智能穿戴设备在基于所述语音采集单元采集到语音信号之后,将采集的所述语音信号发送给云端,所述云端在接收到所述语音信号之后,对所述语音信号进行语音识别以得到语音信息,然后将所述语音信息与预置的意图关键词进行匹配,从而获取与所述意图关键词对应的一条或多条响应参数并返回给所述智能穿戴设备,所述智能穿戴设备接收所述云端发送的与所述意图关键词对应的一条或多条响应参数。
在所述智能穿戴设备接收所述响应参数之后,为了与所述响应参数所包括的内容相对应,所述智能穿戴设备可以被配置为获取当前运行的应用以及当前显示的应用页面、或者获取两者其中之一,在第一种可能的方式中,若所述智能穿戴设备获取当前运行的应用以及当前显示的应用页面,则检测所述当前运行的应用与所述待响应的应用是否匹配,以及检测所述当前显示的应用页面与所述待响应的应用页面是否匹配;在第二种可能的方式中,若所述智能穿戴设备只获取当前运行的应用,则检测所述当前运行的应用与所述待响应的应用是否匹配;在第三种可能的实现方式中,若所述智能穿戴设备只获取当前显示的应用页面,则检测所述当前显示的应用页面与所述待响应的应用页面是否匹配;在以上三种情况中,若匹配,则所述智能穿戴设备基于所述响应触发方式触发所述当前显示的应用执行所述响应指令,否则,不响应所述语音信息。
可以看出,对于云端而言,只需响应于智能穿戴设备的语音信号并返回相应的参数即可,其无需知道语音信号的具体执行含义,而是由智能穿戴设备来执行所述语音信号的具体含义,即是说,云端只需基于既定的流程执行即可,无需对云端做任何流程上的改动,从而使得本公开实施例的语音响应方法可以接入任何厂商的语音识别云端,具有良好的兼容性,而且,只需在智能穿戴设备上进行改进即可实现本公开实施例的语音响应方法,对于只能借用其他厂商的语音识别云端的智能穿戴设备也同样适用,具有广泛的适用性;进一步地,本公开实施例将相关的参数(意图关键词及对应的响应参数)配置在云端,当需要对相关的参数进行更新时,只需在云端上进行修改或替换,则接入云端的所有智能穿戴设备均可按照更新后的规则进行语音响应,操作简单高效,避免将相关的参数配置在智能穿戴设备上由于部分用户未更新固件、系统等而难以按照更新后的规则进行语音响应问题。
在一实现方式中,以所述响应参数包括待响应的应用、待响应的应用页面、响应触发方式以及对应的响应指令,且所述响应触发方式包括控件以及模拟用户触发该控件的操作为例进行说明:所述智能穿戴设备上包括一语音助手的应用程序,所述语音助手将所述声音采集单元采集的语音信号发送给云端,以从所述云端接收所述语音信号对应的语音信息以及相应的一条或多条响应参数,所述响应参数包括待响应的应用、待响应的应用页面、响应触发方式以及所述响应触发方式触发的响应指令,所述响应触发方式表示执行所述响应指令的触发操作,,则所述语音助手在检测到所述当前运行的应用为所述待响应的应用以及当前显示的应用页面为所述待响应的应用页面之后,模拟用户的操作触发所述控件,以使当前运行的应用执行所述响应指令。
作为例子,假设待响应的应用为音乐播放应用,当前显示的应用页面为某首歌曲的播放页面,该播放页面中在三个不同的位置设置有三个功能控件:“上一首”功能控件,暂停功能控件以及“下一首”功能控件;相关技术中若用户想要触发其中的任一功能控件,用户需要在该功能控件上进行点击。而利用本说明书实施例的方案,当用户说出“暂停”,本实施例方案在识别出用户期望应用执行暂停功能后,可以模拟用户的操作触发暂停功能控件,则音乐播放应用通过该暂停功能控件检测到该控件被触发,因此会执行暂停功能,从而实现了语音控制。
在一种可能的实现方式中,为了进一步提高用户的使用体验,减少用户的操作步骤,所述响应参数中的响应指令可以被配置为复合型响应指令,所述复合型响应指令表示执行接下来的操作所需要响应的多条指令,作为例子,比如所述智能穿戴设备当前显示的应用为运动应用,当接收到用户“我要跑步”的语音信号时,由于进行跑步模式功能的前提是执行打开跑步模式以及打开定位的功能,则为了减少用户还需打开定位应用并打开定位功能的繁琐操作,可以预先设置所述响应参数包括运动应用、运动应用的页面、开启跑步模式的触发方式以及对应的打开跑步模式并打开定位功能的指令,或者所述响应参数包括运动应用、运动应用的页面两者之一以及其他参数,从而优化用户的使用体验。
需要说明的是,所述智能穿戴设备除了能够基于上述语音响应方法响应特定应用内的语音信号,以执行所述特定应用内的应用响应指令之外,也支持相关技术中通用的语音响应方法,响应于用户输入的语音信号以执行通用响应指令,比如在所述智能穿戴设备的应用显示界面上,采集到用户“我想听歌”的语音信号,所述智能穿戴设备可以基于所述语音信号执行打开音乐应用这个通用响应指令。
可以看出,本公开实施例能够根据应用确定用户语音的意图,并基于用户的语音执行应用的响应指令,给出用户想要的响应结果,对于智能穿戴设备这些显示屏有限的设备,比起触摸交互带来的不友好体验,通过语音交互来控制应用的具体功能更为便利,解放用户双手,显著提高用户的使用体验;并且,由于本公开实施例可以在任何应用打开的情况下启动所述声音采集单元,且声音采集单元与所述应用相互独立,即是说声音采集单元的启动不依赖于应用本身是否具备语音采集以及语音控制的相关功能,应用本身无需配置语音采集以及语音控制的相关功能,应用本身无需做任何有关语音控制的改进,也可以实现通过语音控制该应用的具体功能,从而避免开发人员改进应用带来的繁琐操作,同时使用该应用的用户也无需从应用商店更新应用以使应用具备语音采集功能,从而提高用户的使用体验。
请参阅图2,图2是本公开根据一示例性实施例示出的第二种语音响应方法的流程图,所述语音响应方法可以由智能穿戴设备来执行,所述方法包括:
在步骤s201中,将采集的语音信号发送给云端,以从云端获取识别所述语音信号得到的语音信息。
在步骤s202中,获取当前运行的应用和/或当前显示的应用页面对应的响应参数,所述响应参数包括一条或多条预置文本信息以及对应的响应指令。
在步骤s203中,匹配所述文本信息与所述语音信息,若所述语音信息匹配所述预置文本信息,执行所述预置文本信息对应的响应指令。
在一实施例中,预先在所述智能穿戴设备上配置与应用和应用页面、或者与两者其中之一对应的文本信息,比如配置短信应用和短信回复页面对应“我要回复”、“短信回复”或者“发短信”等文本信息;所述智能穿戴设备包括声音采集单元,所述声音采集单元用于采集用户的语音信号,所述声音采集单元可以是麦克风、拾音器等设备。
在本公开实施例中,所述智能穿戴设备通过所述声音采集单元采集语音信号,并将所述语音信号发送给云端,云端接收并识别所述语音信号得到语音信息,然后将识别的语音信息返回给所述智能穿戴设备,同时为了与预先配置的信息相对应,所述智能穿戴设备获取当前运行的应用和当前显示的应用页面、或者两者其中之一对应的响应参数,所述响应参数包括一条或多条预置文本信息以及对应的响应指令,然后将当前运行的应用和应用页面、或者两者其中之一对应的预置文本信息与所述语音信息进行匹配,若所述语音信息匹配所述预置文本信息,表明命中用户的语音意图,则执行所述预置文本信息对应的响应指令,否则,不响应所述语音信号;本公开实施例实现通过语音控制应用的具体功能,解放用户双手,提高用户的使用体验。
请参阅图3,图3是本公开根据一示例性实施例示出的第三种语音响应方法的流程图,所述语音响应方法可以由云端来执行,所述云端可以是具备语音识别功能的云服务器,所述方法包括:
在步骤s301中,接收智能穿戴设备发送的语音信号,识别所述语音信号得到的语音信息。
在步骤s302中,基于所述语音信息匹配预置的意图关键词,以获取与所述意图关键词对应的一条或多条响应参数;所述意图关键词表示所述语音信息可能执行的操作;所述响应参数包括待响应的应用和/或待响应的应用页面以及、对应的响应指令。
在步骤s303中,接收所述智能穿戴设备发送的当前运行的应用和/或当前显示的应用页面,若所述当前运行的应用为所述待响应的应用、和/或所述当前显示的应用页面为所述待响应的应用页面,将所述响应指令发送给所述智能穿戴设备,以使所述智能穿戴设备执行所述响应指令。
在一实施例中,预先在云端配置意图关键词以及意图关键词对应的一条或多条响应参数,所述意图关键词表示所述语音消息语音信息可能执行的操作;另外,所述响应参数可以包括以下内容:在第一种可能的实现方式中,所述响应参数可以包括待响应的应用、响应触发方式以及对应的响应指令;在第二种可能的实现方式中,所述响应参数可以包括待响应的应用页面、响应触发方式以及对应的响应指令;在第三种可能的实现方式中,所述响应参数可以包括待响应的应用、待响应的应用页面、响应触发方式以及对应的响应指令。
在本公开实施例中,在所述云端接收到所述智能穿戴设备发送的语音信号,并且,若所述响应参数包括待响应的应用和待响应的应用页面,所述智能穿戴设备被配置为发送当前运行的应用和当前显示应用页面;若所述响应参数包括待响应的应用,所述智能穿戴设备被配置为发送当前运行的应用;若所述响应参数包括待响应的应用页面,所述智能穿戴设备被配置为发送当前显示应用页面;所述云端识别所述语音信号得到语音信息,并将所述语音信息与预置的意图关键词进行匹配,获取与所述意图关键词对应的一条或多条响应参数,若所述响应参数包括待响应的应用和待响应的应用页面,所述云端检测所述当前运行的应用是否为所述待响应的应用,以及检测所述当前显示的应用页面是否为所述待响应的应用页面;若所述响应参数包括待响应的应用,所述云端检测所述当前运行的应用是否为所述待响应的应用;若所述响应参数包括待响应的应用页面,所述云端检测所述当前显示的应用页面是否为所述待响应的应用页面;在以上三种情况中,若是,则所述云端将所述响应触发方式以及对应的响应指令发送给所述智能穿戴设备,使得所述智能穿戴设备基于所述响应触发方式触发所述当前运行的应用执行所述响应指令,否则,不响应所述语音信息。
可以理解的是,上述实施例仅作为示例性的,当前运行的应用、当前显示的应用页面中一种或多种可以与语音信号同时发送,也可以不同时发送,本申请对此并不做限定。本公开实施例通过对云端进行改进,利用云端强大的计算资源实现基于语音控制应用的具体功能,实现在智能穿戴设备上通过语音交互的方法替代触摸交互的方法,提高用户的使用体验;进一步地,本公开实施例将相关的参数(意图关键词及对应的响应参数)配置在云端,当需要对相关的参数进行更新或者对语音响应功能进行改进时,只需在云端上进行修改或替换,则接入云端的所有智能穿戴设备均可按照更新后的规则进行语音响应,操作简单高效,避免将相关的参数配置在智能穿戴设备上由于部分用户未更新固件、系统等难以按照更新后的规则进行语音响应问题。
请参阅图4,图4是本公开根据一示例性实施例示出的第四种语音响应方法的流程图,所述语音响应方法可以由与智能穿戴设备关联的移动终端来执行,所述移动终端可以是手机、个人平板或者电脑等,所述方法包括:
在步骤s401中,接收云端发送的语音信息;所述语音信息为关联的智能穿戴设备将采集的语音信号发送给云端之后,由所述云端识别所述语音信号得到的。
在步骤s402中,接收所述云端发送的与所述语音信息相应的一条或多条响应参数;所述响应参数为所述云端基于所述语音信息匹配预置的意图关键词,获取与所述意图关键词对应的一条或多条响应参数并返回的;所述响应参数包括待响应的应用和/或待响应的应用页面、以及对应的响应指令。
在步骤s403中,接收所述智能穿戴设备发送的当前运行的应用和/或当前显示的应用页面,若当前运行的应用为所述待响应的应用、和/或当前显示的应用页面为所述待响应的应用页面,将所述响应指令发送给所述智能穿戴设备,以使所述智能穿戴设备执行所述响应指令。
在一实施例中,预先在云端配置意图关键词以及意图关键词对应的一条或多条响应参数,所述意图关键词表示所述语音消息语音信息可能执行的操作;另外,所述响应参数可以包括以下内容:在第一种可能的实现方式中,所述响应参数可以包括待响应的应用、响应触发方式以及对应的响应指令;在第二种可能的实现方式中,所述响应参数可以包括待响应的应用页面、响应触发方式以及对应的响应指令;在第三种可能的实现方式中,所述响应参数可以包括待响应的应用、待响应的应用页面、响应触发方式以及对应的响应指令。
在本公开实施例中,所述移动终端可以通过蓝牙连接所述智能穿戴设备,以接收所述智能穿戴设备发送的语音信号,所述智能穿戴设备同时也将所述语音信号发送给云端,以使云端接收并识别所述语音信号得到语音信息,所述移动终端可以基于所述语音信号向所述云端发起语音回调指令,以接收所述云端发送的所述语音信号对应的语音信息,同时所述云端基于识别出的语音信息匹配预置的意图关键词,获取与所述意图关键词对应的一条或多条响应参数并返回给所述移动终端。
与所述响应参数相对应,所述移动终端也接收所述智能穿戴设备发送的当前运行的应用和当前显示的应用页面、或者两者其中之一的相关信息,若从云端接收的所述响应参数包括待响应的应用和待响应的应用页面,所述移动终端检测所述当前运行的应用是否为所述待响应的应用,以及检测所述当前显示的应用页面是否为所述待响应的应用页面;若所述响应参数包括待响应的应用,所述移动终端检测所述当前运行的应用是否为所述待响应的应用;若所述响应参数包括待响应的应用页面,所述移动终端检测所述当前显示的应用页面是否为所述待响应的应用页面;在以上三种情况中,若是,则所述移动终端将所述响应触发方式以及对应的响应指令发送给所述智能穿戴设备,使得所述智能穿戴设备基于所述响应触发方式触发所述当前运行的应用执行所述响应指令,否则,不响应所述语音信息。
可以理解的是,上述实施例仅作为示例性的,当前运行的应用、当前显示的应用页面中一种或多种可以与语音信号同时发送,也可以不同时发送,本申请对此并不做限定。
本公开实施例通过对移动终端进行改进,使得移动终端可以根据应用明确用户的语音意图,实现通过语音控制应用的具体功能,提高用户的使用体验;进一步地,本公开实施例将相关的参数(意图关键词及对应的响应参数)配置在云端,当需要对相关的参数进行更新时,只需在云端上进行修改或替换,则接入云端的所有移动终端均可按照更新后的规则进行语音响应,操作简单高效,避免将相关的参数配置在智能穿戴设备、移动终端上由于部分用户未更新固件、系统、应用软件等难以按照更新后的规则进行语音响应问题。
在另一种实施例中,也可以在移动终端上配置意图关键词以及意图关键词对应的一条或多条响应参数,比如所述响应参数包括待响应的应用、待响应的应用页面、响应触发方式以及对应的响应指令,所述移动终端基于采集的语音信号,从云端获取识别所述语音信号得到的语音信息,所述移动终端根据所述语音信息匹配预置的意图关键词,获取与意图关键词对应的一条或多条响应参数,并且所述移动终端接收所述智能穿戴设备发送的当前运行的应用和当前显示的应用页面的相关信息,若检测到所述当前运行的应用为所述待响应的应用,以及检测所述当前显示的应用页面为所述待响应的应用页面,将所述响应触发方式以及对应的响应指令发送给所述智能穿戴设备,使得所述智能穿戴设备基于所述响应触发方式触发所述当前运行的应用执行所述响应指令,否则,不响应所述语音信息。
如图5所示,图5是本公开根据一示例性实施例示出的一种语音响应装置的框图,包括:
语音信息获取模块501,被配置为基于采集的语音信号,获取识别所述语音信号得到的语音信息。
响应参数获取模块502,被配置为获取与所述语音信息相应的响应参数;所述响应参数包括待响应的应用和/或待响应的应用页面、以及对应的响应指令。
响应指令执行模块503,被配置为若当前运行的应用为所述待响应的应用、和/或当前显示的应用页面为所述待响应的应用页面,执行所述响应指令。
可选地,所述响应参数还包括响应触发方式。
所述响应指令执行模块503被配置为:
若当前运行的应用为所述待响应的应用、和/或当前显示的应用页面为所述待响应的应用页面,基于所述响应触发方式触发所述当前运行的应用执行所述响应指令。
可选地,所述语音响应方法应用于智能穿戴设备。
所述语音信息获取模块501被配置为:
将采集的所述语音信号发送给云端;所述语音信号用于触发所述云端识别所述语音信号得到语音信息,并基于所述语音信息匹配预置的意图关键词,以获取与所述意图关键词对应的一条或多条响应参数并返回给所述智能穿戴设备;所述意图关键词表示所述语音信息可能执行的操作。
所述响应参数获取模块502被配置为:
接收所述云端发送的与所述意图关键词对应的一条或多条响应参数。
可选地,所述语音响应方法应用于智能穿戴设备。
所述语音信息获取模块501,被配置为:
将采集的语音信号发送给云端,以从云端获取识别所述语音信号得到的语音信息。
所述响应参数获取模块502以及所述响应指令执行模块503,被配置为:
获取当前运行的应用和/或当前显示的应用页面对应的响应参数;所述响应参数还包括一条或多条预置文本信息;匹配所述文本信息与所述语音信息,若所述语音信息匹配所述预置文本信息,执行所述预置文本信息对应的响应指令。
可选地,所述语音响应方法应用于云端。
所述语音信息获取模块501被配置为:
接收智能穿戴设备发送的语音信号,识别所述语音信号得到的语音信息。
所述响应参数获取模块502被配置为:
基于所述语音信息匹配预置的意图关键词,以获取与所述意图关键词对应的一条或多条响应参数;所述意图关键词表示所述语音信息的可能执行的操作。
所述响应指令执行模块503被配置为:
应用和/或应用页面接收子模块,被配置为接收所述智能穿戴设备发送的当前运行的应用和/或当前显示的应用页面。
响应指令发送子模块,被配置为若所述当前运行的应用为所述待响应的应用、和/或所述当前显示的应用页面为所述待响应的应用页面,将所述响应指令发送给所述智能穿戴设备,以使所述智能穿戴设备执行所述响应指令。
可选地,所述语音响应方法应用于移动终端;所述移动终端与智能穿戴设备关联。
所述语音信息获取模块501被配置为:
接收云端发送的语音信息;所述语音信息为关联的智能穿戴设备将采集的语音信号发送给云端之后,由所述云端识别所述语音信号得到的。
所述响应参数获取模块502被配置为:
接收所述云端发送的与所述语音信息相应的一条或多条响应参数;所述响应参数为所述云端基于所述语音信息匹配预置的意图关键词,获取与所述意图关键词对应的一条或多条响应参数并返回的。
所述响应指令执行模块503被配置为:
应用和/或应用页面接收子模块,被配置为接收所述智能穿戴设备发送的当前运行的应用和/或当前显示的应用页面。
响应指令发送子模块,被配置为若当前运行的应用为所述待响应的应用、和/或当前显示的应用页面为所述待响应的应用页面,将所述响应指令发送给所述智能穿戴设备,以使所述智能穿戴设备执行所述响应指令。
可选地,所述智能穿戴设备包括声音采集单元。
所述语音信号为所述智能穿戴设备响应于用户的唤醒操作,启动所述声音采集单元采集得到的。
可选地,所述智能穿戴设备包括惯性传感器。
所述唤醒操作包括指定控件的触发操作或者基于所述惯性传感器采集的数据确定的用户的指定动作。上述显示装置中各个模块的功能和作用的实现过程具体详见上述显示方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
相应的,本公开还提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,
所述处理器被配置为执行如上所述语音响应方法中的操作。
其中,所述电子设备可以是智能穿戴设备、云服务器或者移动终端。
图6是根据一示例性实施例示出的一种语音响应装置应用的电子设备的结构示意图。
如图6所示,根据一示例性实施例示出的一种电子设备600,该电子设备600可以是智能穿戴设备、云服务器或者移动终端。
参照图6,电子设备600可以包括以下一个或多个组件:处理组件601,存储器602,电源组件603,多媒体组件604,音频组件605,输入/输出(i/o)的接口606,传感器组件607,以及通信组件608。
处理组件601通常控制电子设备600的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件601可以包括一个或多个处理器609来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件601可以包括一个或多个模块,便于处理组件601和其它组件之间的交互。例如,处理组件601可以包括多媒体模块,以方便多媒体组件604和处理组件601之间的交互。
存储器602被配置为存储各种类型的数据以支持在电子设备600的操作。这些数据的示例包括用于在电子设备600上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器602可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
电源组件603为电子设备600的各种组件提供电力。电源组件603可以包括电源管理系统,一个或多个电源,及其它与为电子设备600生成、管理和分配电力相关联的组件。
多媒体组件604包括在所述电子设备600和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件604包括一个前置摄像头和/或后置摄像头。当电子设备600处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件605被配置为输出和/或输入音频信号。例如,音频组件605包括一个麦克风(mic),当电子设备600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器602或经由通信组件608发送。在一些实施例中,音频组件605还包括一个扬声器,用于输出音频信号。
i/o接口602为处理组件601和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件607包括一个或多个传感器,用于为电子设备600提供各个方面的状态评估。例如,传感器组件607可以检测到电子设备600的打开/关闭状态,组件的相对定位,例如所述组件为电子设备600的显示器和小键盘,传感器组件607还可以检测电子设备600或电子设备600一个组件的位置改变,用户与电子设备600接触的存在或不存在,电子设备600方位或加速/减速和电子设备600的温度变化。传感器组件607可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件607还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件607还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器、心率信号传感器、心电图传感器、指纹传感器或温度传感器。
通信组件608被配置为便于电子设备600和其它设备之间有线或无线方式的通信。电子设备600可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件608经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件608还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其它技术来实现。
在示例性实施例中,电子设备600可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其它电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器602,上述指令可由电子设备600的处理器609执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
其中,当所述存储介质中的指令由所述处理器609执行时,使得电子设备600能够执行前述语音响应方法。
一种计算机可读存储介质,其上存储有计算机程序,当由一个或多个处理器执行时,使得处理器执行上述语音响应方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
以上所述仅为本公开的较佳实施例而已,并不用以限制本公开,凡在本公开的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本公开保护的范围之内。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除