HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

语音控制方法、装置、电子设备和计算机可读存储介质与流程

2021-01-28 14:01:02|278|起点商标网
语音控制方法、装置、电子设备和计算机可读存储介质与流程

本申请涉及计算机技术领域,特别是涉及一种语音控制方法、装置、电子设备和计算机可读存储介质。



背景技术:

随着科技的进步和发展,电子设备逐渐成为人们日常生活中必不可少的部分,当前电子设备上很多操作都是以显式按钮或者隐藏式按钮实现操作目的,用显式按钮或者隐藏式按钮实现操作有很多不便之处。

例如,在电子设备进行拍照或拍摄视频的场景下,根据拍照功能设置显式按钮,若显示按钮数量多,则会屏幕显示效果变差;若根据拍照功能设置隐藏式按钮,功能过多会使隐藏式按钮隐藏过深而操作费时,且,在电子设备的显示屏较大的情况下,需要两手配合才能完成操作。

上述用户与电子设备通过按钮进行操作的交互方式,会导致用户体验感较差。



技术实现要素:

本申请实施例提供了一种语音控制方法、装置、电子设备、计算机可读存储介质,可以实现用户与终端的语音交互,提升用户的体验感。

一种语音控制方法,包括:

获取语音指令,并对语音指令进行语义分析,获取语音指令对应的语义特征;

根据语义特征确定待操作应用的标识;

根据语义特征查询待操作应用的标识对应的映射关系表,得到语义特征对应的目标操作指令;映射关系表包括语义特征与操作指令之间的对应关系;

根据目标操作指令执行相应的操作。

在其中一个实施例中,上述映射关系表包括第一映射关系表和第二映射关系表;第一映射关系表用于表征语义特征与跳转操作指令之间的对应关系;第二映射关系表用于表征语义特征与参数调整操作指令之间的对应关系。

在其中一个实施例中,上述根据语义特征查询待操作应用的标识对应的映射关系表,得到语义特征对应的目标操作指令,包括:

根据待操作应用的标识检测待操作应用的当前状态;

若待操作应用为运行状态,则根据语义特征,查询第一映射关系表和第二映射关系表,确定目标操作指令;目标操作指令为跳转操作指令或参数调整指令;

若待操作应用为未启动状态,则根据语义特征查询第一映射关系表,确定语义特征对应的跳转操作指令作为第一目标操作指令,根据语义特征查询第二映射关系表,确定语义特征对应的参数调整操作指令作为第二目标操作指令。

在其中一个实施例中,上述根据语义特征查询待操作应用的标识对应的映射关系表,得到语义特征对应的目标操作指令,还包括:

判断待操作应用的标识与当前正在运行的应用的标识是否一致;

若一致,则根据语义特征查询第一映射关系表和第二映射关系表,确定目标操作指令;目标操作指令为跳转操作指令或参数调整指令;目标操作指令为跳转操作指令或参数调整指令;

若不一致,则根据语义特征查询第一映射关系表,确定语义特征对应的跳转操作指令作为第一目标操作指令,根据语义特征查询第二映射关系表,确定语义特征对应的参数调整操作指令作为第二目标操作指令。

在其中一个实施例中,若目标操作指令为跳转操作指令,则根据目标操作指令执行相应的操作,包括:

在显示界面上显示提示信息;提示信息用于提醒用户是否需要跳转至待操作应用;

基于显示界面获取跳转指令;

若跳转指令为同意跳转,则启动待操作应用;

若跳转指令为拒绝跳转,则不响应跳转指令。

在其中一个实施例中,若目标操作指令为参数调整操作指令,则根据目标操作指令执行相应的操作,包括:

根据参数调整操作指令确定目标参数和对应的参数调整步长,根据参数调整步长,调整待操作应用的目标参数。

在其中一个实施例中,在上述获取语音指令之后,该方法还包括:

获取语音指令的声纹特征;

根据声纹特征和预设的合法声纹数据库,判断语音指令是否合法;

若语音指令为合法指令,则执行对语音指令进行语义分析,获取语音指令对应的语义特征的步骤;

若语音指令为非法指令,则不响应语音指令。

在其中一个实施例中,上述根据声纹特征和预设的合法声纹数据库,判断语音指令是否合法,包括:

将声纹特征与合法声纹数据库中每一条合法声纹信息进行对比;

若存在任意一条合法声纹信息与声纹特征一致,则确定声纹特征对应的语音指令为合法指令;

若合法声纹数据库中所有合法声纹信息均与声纹特征不一致,则确定声纹特征对应的语音指令为非法指令。

在其中一个实施例中,该方法还包括:

若语音指令为非法指令,则输入提示信息;提示信息用于提示用户输入语音指令失败,重新输入语音指令。

一种语音控制装置,包括:

获取模块,用于获取语音指令,并对语音指令进行语义分析,获取语音指令对应的语义特征;

第一确定模块,用于根据语义特征确定待操作应用的标识;

第二确定模块,用于根据语义特征查询待操作应用的标识对应的映射关系表,得到语义特征对应的目标操作指令;映射关系表包括语义特征与操作指令之间的对应关系;

执行模块,用于根据目标操作指令执行相应的操作。

一种电子设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行该计算机程序时实现上述语音控制方法。

一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述语音控制方法。

上述语音控制方法、装置、电子设备和存储介质,终端通过获取语音指令,对语音指令进行语义分析,获取语音指令对应的语义特征,根据语义特征确定待操作应用的标识,从而根据语义特征查询待操作应用的标识对应的映射关系表,得到语义特征对应的目标操作指令,进而根据目标操作指令执行相应的操作。本方法中,映射关系表包括语义特征与操作指令之间的对应关系,终端可以根据对语音指令分析后的语义特征和预设的映射关系表,确定该语音指令对应的目标操作指令,从而实现语音控制终端执行操作指令的目的,避免了按钮式输入或触屏输入的繁琐,简化了控制终端的过程,且根据用户的语音指令进行对应目标操作指令的操作,可以最大程度的贴近用户的需求,有效的满足用户所需的效果,优化了用户体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为一个实施例中语音控制方法的应用环境图;

图2为一个实施例中语音控制方法的流程图;

图3为一个实施例中语音控制方法的流程图;

图4为一个实施例中语音控制方法的流程图;

图5为一个实施例中语音控制方法的流程图;

图6为一个实施例中语音控制方法的流程图;

图7为一个实施例中语音控制方法的流程图;

图8为一个实施例中语音控制方法的流程图;

图9为一个实施例中语音控制装置的结构框图;

图10为一个实施例中语音控制装置的结构框图;

图11为一个实施例中语音控制装置的结构框图;

图12为一个实施例中电子设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一客户端称为第二客户端,且类似地,可将第二客户端称为第一客户端。第一客户端和第二客户端两者都是客户端,但其不是同一客户端。

图1为一个实施例中语音控制方法的应用环境示意图。如图1所示,该应用环境包括终端101,终端101通过接收用户发出的音频数据,生成语音指令,并根据语音指令和预设的音频识别方法、语义识别方法、以及声纹识别方法对语音指令进行分析,以实现用户通过语音指令控制终端执行目标操作的目的。其中,终端101可以为任意一种具有人机交互功能的智能终端,例如,智能手机、智能音箱、便携式设备、平板电脑等。

图2为一个实施例中语音控制方法的流程图。本实施例中的语音控制方法,以运行于图1中的终端上为例进行描述。如图2所示,语音控制方法包括步骤201至步骤204。

步骤201,获取语音指令,并对语音指令进行语义分析,获取语音指令对应的语义特征。

具体地,语音指令指的是用户发出的、或其他智能设备发出的音频数据,该音频数据中包括针对终端的操作需求。可选地,终端在接收到语音指令之后,可以通过音频识别技术对该语音指令进行分析,得到该语音指令中包括的语义特征。

在本实施例中,可选地,终端可以通过任意一种成熟的音频识别技术对该语音指令进行分析,本实施例中对音频识别技术不做限定,示例地,语音指令可以为“调高相机的拍摄亮度”,终端经过语义分析,得到的语义特征可以包括“相机”、“拍摄亮度”、“调高”,本实施例对此不做限定。

步骤202,根据语义特征确定待操作应用的标识。

具体地,待操作应用可以为终端中安装的任意一个应用,示例地,待操作应用可以为相机、音乐播放器、视频播放器等。待操作应用的标识指的是待操作应用的唯一标识,示例地,相机的应用标识可以为“cam01”,音乐播放器的应用标识可以为“music01”。可选地,终端还可以预先构建语义特征与待操作应用之间的对应关系、以及待操作应用与应用标识之间的对应关系。

在本实施例中,以上述例子说明,当语音指令为“调高相机的拍摄亮度”,终端获取到的语义特征包括“相机”、“拍摄亮度”、“调高”,终端根据语义特征与待操作应用之间的对应关系,确定语义特征“相机”对应的待操作应用为相机,根据待操作应用与应用标识之间的对应关系,确定待操作应用相机对应的应用标识为“cam01”;又如,当语音指令为“调高照相机的拍摄亮度”,终端获取到的语义特征包括“照相机”、“拍摄亮度”、“调高”,此时,根据语义特征与待操作应用之间的对应关系,确定语义特征“照相机”对应的待操作应用为相机,根据待操作应用与应用标识之间的对应关系,确定待操作应用相机对应的应用标识为“cam01”,本实施例对此不做限定。

步骤203,根据语义特征查询待操作应用的标识对应的映射关系表,得到语义特征对应的目标操作指令;映射关系表包括语义特征与操作指令之间的对应关系。

可选地,映射关系表包括第一映射关系表和第二映射关系表;第一映射关系表用于表征语义特征与跳转操作指令之间的对应关系;第二映射关系表用于表征语义特征与参数调整操作指令之间的对应关系。

具体地,目标操作指令包括多种类型的操作指令,示例地,目标操作指令可以为跳转操作指令,还可以为参数调整操作指令,针对不同类型的操作指令,预先设定不同映射关系表,其中,第一映射表指的是跳转操作指令与语义特征之间的对应关系,第二映射表指的是参数调整操作指令与语义特征之间的对应关系。

在本实施例中,不同的应用对应不同的第一映射关系表和第二映射关系表,以上述例子说明,待操作应用标识为“cam01”对应的第一映射表中可以包括语义特征“相机”与跳转操作指令“打开相机”之间的对应关系;对应的第二映射表中可以包括语义特征“拍摄亮度”、“调高”与参数调整操作指令“调高亮度”之间的对应关系。具体地,终端在获取到语义特征“照相机”、“拍摄亮度”、“调高”之后,根据语义特征“照相机”,确定待操作应用为相机,且待操作应用标识为“cam01”,根据该待操作应用标识,从其对应的第一映射关系表查询确定跳转操作指令为“打开相机”,从其对应的第二关系表中确定参数调整操作指令“调高亮度”,本实施例对此不做限定。

步骤204,根据目标操作指令执行相应的操作。

在本实施例中,终端根据目标操作指令执行相应的操作,其中目标操作指令的类型包括跳转操作指令、参数调整指令、动作操作指令等多种类型;示例地,当目标操作指令为跳转操作指令,终端可以根据该跳转操作指令执行相应的跳转动作,具体地,跳转操作指令指的是终端从当前状态跳转到跳转操作指令对应的应用,即执行开启跳转操作指令对应的应用;当目标操作指令为参数调整指令,终端可以根据该参数调整指令执行相应的参数调整动作,具体地,参数调整指令指的是对当前应用中对应的参数值的进行调整的指令,例如,在相机应用下,调整拍摄亮度、拍摄景深、拍摄对比度、拍摄距离等;当目标操作指令为动作操作指令,终端可以根据动作操作指令的语义特征执行相应的动作,具体地,动作操作指令主要是针对当前状态下的操作,例如,在相机应用下,执行拍照的动作;在音乐播放器应用下,执行暂停的动作;在聊天平台应用下,执行发送消息的动作,本实施例对此不做限定。

本实施例中的语音控制方法,终端通过获取语音指令,对语音指令进行语义分析,获取语音指令对应的语义特征,根据语义特征确定待操作应用的标识,从而根据语义特征查询待操作应用的标识对应的映射关系表,得到语义特征对应的目标操作指令,进而根据目标操作指令执行相应的操作。本方法中,映射关系表包括语义特征与操作指令之间的对应关系,终端可以根据对语音指令分析后的语义特征和预设的映射关系表,确定该语音指令对应的目标操作指令,从而实现语音控制终端执行操作指令的目的,避免了按钮式输入或触屏输入的繁琐,简化了控制终端的过程,且根据用户的语音指令进行对应目标操作指令的操作,可以最大程度的贴近用户的需求,有效的满足用户所需的效果,优化了用户体验。

终端根据语义特征查询待操作应用的标识对应的映射关系表时,可以先确定待操作应用的运行状态,其中一种情况为,检测待操作应用的状态,在一个实施例中,如图3所示,上述根据语义特征查询待操作应用的标识对应的映射关系表,得到语义特征对应的目标操作指令,包括步骤301至步骤303。

步骤301,根据待操作应用的标识检测待操作应用的当前状态;若待操作应用为运行状态,则执行步骤302;若待操作应用为未启动状态,则执行步骤303。

具体地,待操作应用的当前状态指的是待操作应用当前处于运行,或后台运行,或未启动的状态。

在本实施例中,终端根据从语音指令的语义特征,确定语音指令对应的待操作应用标识,根据该待操作应用标识,检测该待操作应用的状态。示例地,终端若根据语义特征,确定待操作应用标识为“cam01”,则确定待操作应用为相机,此时,终端检测相机的状态,若相机的当前状态为运行状态,即终端当前的界面即为相机的界面,则终端根据直接语义特征与映射关系表,确定在当前界面,即相机应用下的目标操作指令;若终端检测到相机的当前状态为后台运行或未启动的状态,即终端当前的界面为非相机界面,此时终端需要根据语义特征与第一映射关系表,开启相机应用,从而在相机应用下,根据语义特征与第二映射关系表,确定相应的目标操作指令,本实施例对此不做限定。

步骤302,根据语义特征,查询第一映射关系表和第二映射关系表,确定目标操作指令;目标操作指令为跳转操作指令或参数调整指令。

具体地,终端确定语义特征中对应的待操作应用为正在运行的状态,在待操作应用下,根据第一映射关系表和第二关系映射表,确定语义特征对应的目标操作指令。

在本实施例中,示例地,语音指令为“调高相机亮度”,其语义特征包括“相机”、“调高”、“亮度”,终端确定当前语音特征对应的待操作应用标识为“cam01”,并且检测到“cam01”对应的应用相机处于正在运行状态,即终端当前的显示界面即为相机界面,在这种情况下,可选地,终端可以直接根据语义特征和第二映射关系表,确定目标操作指令,示例地,终端根据“调高”、“亮度”和第二关系映射表,确定的目标操作指令为参数调整操作指令“调高亮度”;或者,终端可以同时根据语义特征,查询第一映射关系表和第二映射关系表,得到第一映射关系表中对应的目标操作指令和第二映射关系表中对应的目标操作指令,以上述例子说明,根据该语义特征,从第一映射表中确定的目标操作指令为“打开相机”,从第二映射表中确定的目标操作指令为“调高亮度”,而此时,相机正处于运行状态,所以,终端可以选择忽略第一映射表的目标操作指令,从而直接执行第二映射表的目标操作指令,本实施例对此不做限定。

步骤303,根据语义特征查询第一映射关系表,确定语义特征对应的跳转操作指令作为第一目标操作指令,根据语义特征查询第二映射关系表,确定语义特征对应的参数调整操作指令作为第二目标操作指令。

具体地,终端确定语义特征中对应的待操作应用为未运行的状态,即终端当前显示界面运行的应用并不是待操作应用。

在本实施例中,示例地,语音指令为“调高相机亮度”,其语义特征包括“相机”、“调高”、“亮度”,终端确定当前语音特征对应的待操作应用标识为“cam01”,并且检测到“cam01”对应的应用相机处于后台运行或未运行状态,在这种情况下,由于第一映射表中包括的是跳转操作指令与语义特征的对应关系,终端需要先根据第一映射关系表,将运行界面跳转至待操作应用,具体地,终端根据该语义特征,从第一映射表中确定的目标操作指令为“打开相机”,执行“打开相机”的目标操作指令之后,使得相机处于运行状态下,终端再根据语义特征和第二映射关系表,确定目标操作指令,示例地,终端根据“调高”、“亮度”和第二关系映射表,确定的目标操作指令为参数调整操作指令“调高亮度”,本实施例对此不做限定。

在本实施例中,终端可以通过检测待操作应用的状态确定查询第一映射关系表和第二映射关系表的优先级顺序,使得目标操作指令可以在有效的情况下运行,提高了语音控制终端操作的效率。

另一种情况为,根据当前运行的应用标识,与待操作应用标识,确定待操作应用的状态,在一个实施例中,如图4所示,上述根据语义特征查询待操作应用的标识对应的映射关系表,得到语义特征对应的目标操作指令,还包括步骤401至步骤403。

步骤401,判断待操作应用的标识与当前正在运行的应用的标识是否一致;若一致,则执行步骤402;若不一致,则执行步骤403。

在本实施例中,终端根据从语音指令的语义特征,确定语音指令对应的待操作应用标识,可选地,终端还可以获取当前运行应用的应用标识,根据待操作应用标识和当前运行应用的应用标识,进行对比校验。示例地,终端若根据语义特征,确定待操作应用标识为“cam01”,终端获取到的当前运行应用的应用标识为“cam01”,待操作应用的标识与正在运行的应用的标识一致,意味着终端当前运行的应用就是待操作应用,终端根据直接语义特征与映射关系表,确定在当前界面,即相机应用下的目标操作指令;若终端获取到的当前运行应用的应用标识为“music01”,待操作应用的标识与正在运行的应用的标识不一致,意味着终端正在运行的应用并不是待操作应用,此时终端需要根据语义特征与第一映射关系表,开启相机应用,从而在相机应用下,根据语义特征与第二映射关系表,确定相应的目标操作指令,本实施例对此不做限定。

步骤402,根据语义特征查询第一映射关系表和第二映射关系表,确定目标操作指令;目标操作指令为跳转操作指令或参数调整指令。

具体地,终端确定语义特征中对应的待操作应用的应用标识与正在运行的应用的标识一致,即,待操作应用正处于运行的状态。

在本实施例中,示例地,语音指令为“调高相机亮度”,其语义特征包括“相机”、“调高”、“亮度”,终端确定当前语音特征对应的待操作应用标识为“cam01”,终端获取当前运行的应用标识为“cam01”,待操作应用的应用标识与正在运行的应用的标识一致,意味着“cam01”对应的应用相机处于正在运行状态,在这种情况下,终端可以直接根据语义特征和第二映射关系表,确定目标操作指令,示例地,终端根据“调高”、“亮度”和第二关系映射表,确定的目标操作指令为参数调整操作指令“调高亮度”;或者,终端可以同时根据语义特征,查询第一映射关系表和第二映射关系表,得到第一映射关系表中对应的目标操作指令和第二映射关系表中对应的目标操作指令,以上述例子说明,根据该语义特征,从第一映射表中确定的目标操作指令为“打开相机”,从第二映射表中确定的目标操作指令为“调高亮度”,而相机正处于运行状态,所以,终端可以选择忽略第一映射表的目标操作指令,从而直接执行第二映射表的目标操作指令,本实施例对此不做限定。

步骤403,根据语义特征查询第一映射关系表,确定语义特征对应的跳转操作指令作为第一目标操作指令,根据语义特征查询第二映射关系表,确定语义特征对应的参数调整操作指令作为第二目标操作指令。

具体地,终端确定语义特征中对应的待操作应用的应用标识与正在运行的应用的标识不一致,即终端当前显示界面运行的应用并不是待操作应用。

在本实施例中,示例地,语音指令为“调高相机亮度”,其语义特征包括“相机”、“调高”、“亮度”,终端确定当前语音特征对应的待操作应用标识为“cam01”,终端获取当前运行的应用标识为“music01”,待操作应用的应用标识与正在运行的应用的标识不一致,即“cam01”对应的应用相机处于后台运行或未运行状态,在这种情况下,由于第一映射表中包括的是跳转操作指令与语义特征的对应关系,终端需要先根据第一映射关系表,将运行界面跳转至待操作应用,具体地,终端根据该语义特征,从第一映射表中确定的目标操作指令为“打开相机”,执行“打开相机”的目标操作指令之后,使得相机处于运行状态下,终端再根据语义特征和第二映射关系表,确定目标操作指令,示例地,终端根据“调高”、“亮度”和第二关系映射表,确定的目标操作指令为参数调整操作指令“调高亮度”,本实施例对此不做限定。

在本实施例中,终端可以通过检测待操作应用的应用标识与当前运行的应用的标识是否一致,确定查询第一映射关系表和第二映射关系表的优先级顺序,使得目标操作指令可以在有效的情况下运行,提高了语音控制终端操作的效率。

在终端确定目标操作指令后,一种情况下,目标操作指令为跳转操作指令,在一个实施例中,如图5所示,若目标操作指令为跳转操作指令,则根据目标操作指令执行相应的操作,包括步骤501至步骤504。

步骤501,在显示界面上显示提示信息;提示信息用于提醒用户是否需要跳转至待操作应用。

具体地,提醒信息指的是用于提醒用户即将跳转至待操作应用的信息,该提醒信息可以通过弹框的形式呈现,也可通过语音提示的形式呈现。

在本实施例中,当终端根据第一映射关系表,执行相应的跳转操作指令时,可以通过弹框或语音提示的方式,向用户输出跳转提示信息。示例地,在跳转信息为弹框的情况下,该跳转信息中还可以设置确认跳转或拒绝跳转的选项按钮;在跳转信息为语音提醒信息的情况下,终端则处于接收确认跳转或拒绝跳转的语音指令,本实施例对此不做限定。

步骤502,基于显示界面获取跳转指令;若跳转指令为同意跳转,则执行步骤503;若跳转指令为拒绝跳转,则执行步骤504。

步骤503,启动待操作应用。

步骤504,不响应跳转指令。

在本实施例中,以上述例子说明,在跳转信息为弹框的情况下,跳转指令指的是提醒信息中通过选择确认跳转或拒绝跳转的选项按钮而出发的指令;在跳转信息为语音提醒信息的情况下,跳转指令指的是终端接收到的语义特征为确认跳转或拒绝跳转的语音指令。可选地,若终端检测到“确认跳转”按钮被触发,或者分析到语音指令的语义特征包括“确认跳转”,则确定当前跳转指令为同意跳转,终端则执行跳转操作,启动待操作应用;若终端检测到“拒绝跳转”按钮被触发,或者分析到语音指令的语义特征包括“拒绝跳转”或“不跳转”,则确定当前跳转指令为拒绝跳转,此时终端可以选择忽略本次跳转响应,即不执行任何跳转操作,维持当前的运行状态,本实施例对此不做限定。

在本实施例中,终端通过输出提醒信息实现对跳转指令的再次确认,一定程度上保证了跳转操作的有效性和准确性。

在另一种情况下,目标操作指令为参数调整指令,在一个实施例中,若目标操作指令为参数调整操作指令,则根据目标操作指令执行相应的操作,包括:

根据参数调整操作指令确定目标参数和对应的参数调整步长,根据参数调整步长,调整待操作应用的目标参数。

具体地,参数调整步长指的是根据参数属性以及实际调整习惯确定的每一次参数调整指令对应的参数调整幅度。

在本实施例中,终端确定当前目标操作指令为参数调整操作指令,示例地,在相机应用下,目标操作指令为“调高亮度”,终端根据该目标操作指令确定目标参数为亮度,获取亮度对应的调整步长,示例地,调整步长可以为5,可选地,终端还可以获取相机的当前拍摄亮度,在当前拍摄亮度的基础上,增加5个亮度值,完成本次的参数调整操作指令。可选地,参数调整操作指令还可以是针对其他参数的调整指令,示例地,在相机应用下,当语音指令为“让天空更干净”,其对应的语义特征包括“天空”、“干净”,根据语义特征查询到的目标操作指令为“天空去噪”,那么终端根据该目标操作指令确定目标参数为指定区域的噪声值,此时,终端可以通过图像识别算法,确定天空对应的图像特征,利用任意一种去噪算法,对天空进行去噪处理,完成本次的参数调整操作指令,本实施例对此不做限定。

在本实施例中,终端可以根据参数调整操作指令对当前应用下的多个参数进行语音控制调整,避免了多个参数以按钮式出现造成的屏幕占用率高,操作不方便的问题,且,用户根据直观的结果进行语音参数调整,使得调整结果可以更符合用户的调整需求,极大的优化了用户的使用体验。

为了确保终端的安全性,终端可以对语音指令进行合法性校验,在一个实施例中,如图6所示,在上述获取语音指令之后,该方法还包括步骤601至步骤604。

步骤601,获取语音指令的声纹特征。

具体地,声纹特征指的是基于声纹识别技术,提取的语音指令的音色、音质、声波频谱等特征因素。

在本实施例中,终端可以基于任意一种声纹识别技术进行语音指令的声纹特征提取,本实施例对声纹识别技术不做限定。

步骤602,根据声纹特征和预设的合法声纹数据库,判断语音指令是否合法;若语音指令为合法指令,则执行步骤603;若语音指令为非法指令,则执行步骤604。

具体地,合法声纹数据库指的是存储于终端中的声纹数据库,该合法声纹数据库中包括至少一种预先录入的合法声纹特征,该合法声纹特征指的是来自于具有访问终端权限的用户的声纹特征。

在本实施例中,可选地,终端获取到语音指令的声纹特征,将该声纹特征与预先录入的合法声纹数据库中的合法声纹特征进行对比,确定当前语音指令的声纹特征是否为合法声纹特征,即判断当前语音指令是否为合法指令,若当前语音指令为合法指令,则执行步骤603;若当前语音指令为非法指令,则执行步骤604。

步骤603,执行对语音指令进行语义分析,获取语音指令对应的语义特征的步骤。

在本实施例中,终端确定当前语音指令为合法指令,即确定当前用户具有访问终端权限的用户,此时,终端可以执行对语音指令进行语义分析,获取语音指令对应的语义特征的步骤。

步骤604,不响应语音指令。

在本实施例中,终端确定当前语音指令为非法指令,即确定当前用户不具有访问终端权限的用户,此时,终端不响应语音指令,可选地,终端可以持续处于待机状态,或进入待机状态,不对语音指令进行任何操作,本实施例对此不做限定。

在本实施例中,终端根据预设的合法声纹数据库对语音指令的声纹特征进行合法性校验,在确定语音指令为合法指令的情况下,才继续执行对语音指令进行语义分析的步骤,一定程度上保证了访问终端的安全性。

具体地,终端在对声纹特征进行合法性校验时,可以根据预设的合法声纹数据库进行比对校验,在一个实施例中,如图7所示,上述根据声纹特征和预设的合法声纹数据库,判断语音指令是否合法,包括步骤701至步骤703。

步骤701,将声纹特征与合法声纹数据库中每一条合法声纹信息进行对比;若存在任意一条合法声纹信息与声纹特征一致,则执行步骤702;若合法声纹数据库中所有合法声纹信息均与声纹特征不一致,则执行步骤703。

步骤702,确定声纹特征对应的语音指令为合法指令。

步骤703,确定声纹特征对应的语音指令为非法指令。

在本实施例中,终端将语音指令的声纹特征与合法声纹数据库中的每一条合法声纹特征进行对比,即将当前语音指令的音色、音质、声波频谱与合法数据库中,每一条合法声纹信息的音色、音质、声波频谱进行一致性校验,若存在任意一条合法声纹信息与声纹特征一致,则说明,发出语音指令的用户的声纹特征已录入终端合法声纹数据库中,该用户具有访问终端权限,此时,终端确定声纹特征对应的语音指令为合法指令;若合法声纹数据库中所有合法声纹信息均与声纹特征不一致,则说明,发出语音指令的用户的声纹特征并没有录入终端合法声纹数据库中,该用户不具有访问终端权限,此时,终端确定声纹特征对应的语音指令为非法指令,本实施例对此不做限定。

在本实施例中,终端将语音指令的声纹特征与合法声纹数据库中的声纹信息进行一致性校验,可以简单、有效地确定当前语音指令是否为合法指令,即确定发出语音指令的用户是否为具有访问终端权限的用户,保证了访问终端的安全性。

在确定语音指令为非法指令之后,为避免终端判断的偶然性,终端还可以输出提醒信息使得用户再次输入语音指令,在一个实施例中,该方法还包括:

若语音指令为非法指令,则输入提示信息;提示信息用于提示用户输入语音指令失败,重新输入语音指令。

具体地,提醒信息可以以弹框的形式呈现于终端的显示屏中,还可以是通过语音提示的形式呈现。该提醒信息的内容包括提醒用户输入语音指令失败,且需要重新输入语音指令。

在本实施例中,终端判断当前语音指令为非法指令的情况包括多种,一种情况为,发出当前语音指令的用户,并不是具有使用终端权限的用户,故该语音指令对应的声纹特征不具有访问终端的权限,另一种情况为,发出当前语音指令的用户是具有使用终端权限的用户,但是因为环境嘈杂,或其他音频数据干扰,从而导致终端声纹合法性校验失败,在任意一种情况下,为避免声纹合法性校验失败的偶然性,终端可以输出提醒信息,以使用户再次输入语音指令,本实施例对此不做限定。

在本实施例中,终端确定语音指令为非法指令时,输出提醒信息,以使用户再次输入语音指令,避免了声纹合法性校验的偶然性,降低了终端声纹合法性校验的失误率。

在一个实施例中,如图8所示,提供了另一种语音控制方法,包括步骤101至步骤116。

步骤101,获取语音指令;

步骤102,获取语音指令的声纹特征;

步骤103,根据声纹特征和预设的合法声纹数据库,判断语音指令是否合法;若语音指令为非法指令,则执行步骤104;若语音指令为合法指令,则执行步骤105;

步骤104,不响应语音指令;

步骤105,对语音指令进行语义分析,获取语音指令对应的语义特征;

步骤106,根据语义特征确定待操作应用的标识;

步骤107,根据语义特征查询待操作应用的标识对应的映射关系表,得到语义特征对应的目标操作指令;

步骤108,若目标操作指令为跳转操作指令,在显示界面上显示提示信息;

步骤109,基于显示界面获取跳转指令,若跳转指令为同意跳转,则执行步骤110;若跳转指令为拒绝跳转,则执行步骤111;

步骤110,启动待操作应用;

步骤111,不响应跳转指令;

步骤112,若目标操作指令为参数调整操作指令,根据参数调整操作指令确定目标参数和对应的参数调整步长,根据参数调整步长,调整待操作应用的目标参数。

在本实施例中,终端在对语音指令进行声纹特征合法性校验之后,根据对语音指令分析后的语义特征和预设的映射关系表,确定该语音指令对应的目标操作指令,根据不同类型的目标操作指令,实现应用跳转或参数调整的操作,避免了按钮式输入或触屏输入的繁琐,简化了控制终端的过程,且根据用户的语音指令进行对应目标操作指令的操作,可以最大程度的贴近用户的需求,有效的满足用户所需的效果,优化了用户体验。

应该理解的是,虽然图2-8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-8中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

图9为一个实施例的语音控制装置的结构框图。如图9所示,提供了一种语音控制装置,该装置包括获取模块01、第一确定模块02、第二确定模块03和执行模块04,其中:

获取模块01,用于获取语音指令,并对语音指令进行语义分析,获取语音指令对应的语义特征;

第一确定模块02,用于根据语义特征确定待操作应用的标识;

第二确定模块03,用于根据语义特征查询待操作应用的标识对应的映射关系表,得到语义特征对应的目标操作指令;映射关系表包括语义特征与操作指令之间的对应关系;

执行模块04,用于根据目标操作指令执行相应的操作。

在一个实施例中,上述映射关系表包括第一映射关系表和第二映射关系表;第一映射关系表用于表征语义特征与跳转操作指令之间的对应关系;第二映射关系表用于表征语义特征与参数调整操作指令之间的对应关系。

在一个实施例中,第二确定模块03,具体用于根据待操作应用的标识检测待操作应用的当前状态;若待操作应用为运行状态,则根据语义特征,查询第一映射关系表和第二映射关系表,确定目标操作指令;目标操作指令为跳转操作指令或参数调整指令;若待操作应用为未启动状态,则根据语义特征查询第一映射关系表,确定语义特征对应的跳转操作指令作为第一目标操作指令,根据语义特征查询第二映射关系表,确定语义特征对应的参数调整操作指令作为第二目标操作指令。

在一个实施例中,第二确定模块03,还用于判断待操作应用的标识与当前正在运行的应用的标识是否一致;若一致,则根据语义特征查询第一映射关系表和第二映射关系表,确定目标操作指令;目标操作指令为跳转操作指令或参数调整指令;目标操作指令为跳转操作指令或参数调整指令;若不一致,则根据语义特征查询第一映射关系表,确定语义特征对应的跳转操作指令作为第一目标操作指令,根据语义特征查询第二映射关系表,确定语义特征对应的参数调整操作指令作为第二目标操作指令。

在一个实施例中,执行模块04,具体用于在显示界面上显示提示信息;提示信息用于提醒用户是否需要跳转至待操作应用;基于显示界面获取跳转指令;若跳转指令为同意跳转,则启动待操作应用;若跳转指令为拒绝跳转,则不响应跳转指令。

在一个实施例中,执行模块04,还用于根据参数调整操作指令确定目标参数和对应的参数调整步长,根据参数调整步长,调整待操作应用的目标参数。

在一个实施例中,如图10所示,语音控制装置还包括合法性校验模块05,用于获取语音指令的声纹特征;根据声纹特征和预设的合法声纹数据库,判断语音指令是否合法;若语音指令为合法指令,则执行对语音指令进行语义分析,获取语音指令对应的语义特征的步骤;若语音指令为非法指令,则不响应语音指令。

在一个实施例中,合法性校验模块05,具体用于将声纹特征与合法声纹数据库中每一条合法声纹信息进行对比;若存在任意一条合法声纹信息与声纹特征一致,则确定声纹特征对应的语音指令为合法指令;若合法声纹数据库中所有合法声纹信息均与声纹特征不一致,则确定声纹特征对应的语音指令为非法指令。

在一个实施例中,如图11所示,语音控制装置还包括输出模块06,用于若语音指令为非法指令,则输入提示信息;提示信息用于提示用户输入语音指令失败,重新输入语音指令。

上述语音控制装置中各个模块的划分仅仅用于举例说明,在其他实施例中,可将语音控制装置按照需要划分为不同的模块,以完成上述语音控制装置的全部或部分功能。

关于语音控制装置的具体限定可以参见上文中对于语音控制方法的限定,在此不再赘述。上述语音控制装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

图12为一个实施例中电子设备的内部结构示意图。如图12所示,该电子设备包括通过系统总线连接的处理器和存储器。其中,该处理器用于提供计算和控制能力,支撑整个电子设备的运行。存储器可包括非易失性存储介质及内存储器。非易失性存储介质存储有操作系统和计算机程序。该计算机程序可被处理器所执行,以用于实现以下各个实施例所提供的一种语音控制方法。内存储器为非易失性存储介质中的操作系统计算机程序提供高速缓存的运行环境。该电子设备可以是手机、平板电脑、pda(personaldigitalassistant,个人数字助理)、pos(pointofsales,销售终端)、车载电脑、穿戴式设备等任意终端设备。

本申请实施例中提供的语音控制装置中的各个模块的实现可为计算机程序的形式。该计算机程序可在终端或服务器上运行。该计算机程序构成的程序模块可存储在电子设备的存储器上。该计算机程序被处理器执行时,实现本申请实施例中所描述方法的步骤。

本申请实施例还提供了一种计算机可读存储介质。一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当所述计算机可执行指令被一个或多个处理器执行时,使得所述处理器执行语音控制方法的步骤。

一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行语音控制方法。

本申请所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram),它用作外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips