终端控制方法、装置、智能终端及计算机可读存储介质与流程
本发明涉及设备控制技术领域,尤其涉及一种终端控制方法、装置、智能终端及计算机可读存储介质。
背景技术:
随着人工智能技术的兴起,自然语言对话系统提供了一种新型的人机交互方式,可模拟人与人之间的自然对话,为用户提供更加便捷、更加人性化的人机交互体验。目前很多智能终端也都搭载了语音对话系统,使得终端能够拓展更多的使用场景且更加智能化。
在实际的应用场景中,单一功能的终端可通过同一唤醒词唤醒,然而对于同时具有多种功能的终端,由于不同功能之间可能存在相似性,在接收到语音指令时,无法准确定位用户需求。如,电视机的功能有音乐播放、查询天气、设定闹钟及影视功能等,但是在电视机接收到“帮我打开《大约在冬季》”的语音指令时,由于《大约在冬季》可能是一首歌,也可能是一部电影,此时,无法准确判断用户的真正意图是想看电影还是听歌。目前主要通过设置优先级的方式来确定用户意图,但是仍然存在定位不准确的问题。并且,当终端所应用的场景越来越复杂(如应用于智能家居、自动驾驶及智慧城市等复杂的交互场景)时,更加难以准确的定位用户意图。因而,目前的语音交互方案存在无法准确定位用户意图导致语音控制效果差的问题。
技术实现要素:
本发明主要目的在于提供一种终端控制方法、装置、智能终端及计算机可读存储介质,旨在解决现有技术中终端的语音控制无法准确定位用户意图导致语音控制效果差的问题。
为实现上述目的,本发明提供一种终端控制方法,包括:
接收用户的语音指令;
根据语音指令采用主动方式或被动方式从预先划分的多个功能领域中确定目标功能领域;
根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令。
在一些可能的实施方式中,方法还包括:
控制目标应用执行与目标控制指令对应的动作,目标应用为终端中与目标功能领域对应的应用。
此外,为实现上述目的,本发明还提供一种智能终端,该智能终端包括存储器、处理器及存储在处理器上并可在处理器上运行的终端控制程序,处理器执行该终端控制程序时实现上述终端控制方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,该计算机可读存储介质上存储有终端控制程序,该终端控制程序被处理器执行时实现上述终端控制方法的步骤。
本发明实施例通过接收用户的语音指令,并根据语音指令采用主动方式或被动方式从预先划分的多个功能领域中确定目标功能领域,然后根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令。即,先通过主动方式或被动方式确定目标功能领域,再根据所确定的目标功能领域确定与语音指令对应的目标控制指令,避免直接确定语音指令对应的控制指令时无法准确定位用户意图导致语音控制效果较差,提高了语音控制的准确性且提升了用户体验感。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的智能终端结构示意图;
图2是本发明终端控制方法第一实施例的流程示意图;
图3为本发明终端控制方法第二实施例的流程示意图;
图4为本发明终端控制方法第三实施例的流程示意图;
图5为本发明终端控制方法第四实施例的流程示意图;
图6为本发明终端控制装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明的主要解决方案是:接收用户的语音指令;根据语音指令采用主动方式或被动方式从预先划分的多个功能领域中确定目标功能领域;根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令。
目前的语音交互方案无法准确定位用户意图,导致语音控制效果较差,用户体验感不佳。因而,本发明提出一种终端控制方法、装置、智能终端及计算机可读存储介质,通过接收用户的语音指令,并根据语音指令采用主动方式或被动方式从预先划分的多个功能领域中确定目标功能领域,然后根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令,使得终端能够控制目标功能领域对应的应用执行与目标控制指令对应的动作。即,通过主动方式或被动方式先确定目标功能领域,再基于目标功能领域确定目标控制指令以定位用户意图,避免无法准确定位用户意图,导致语音控制效果不佳,提高了语音控制效果且提升了用户体验感。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的智能终端结构示意图。
如图1所示,该智能终端可以包括:通信总线1002,处理器1001,例如cpu,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的智能终端结构并不构成对智能终端的限定,可以包括比图示更多或更少的部件,或组合某些部件,或者不同的部件布置。
在图1所示的智能终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的终端控制程序,并执行以下操作:
接收用户的语音指令;
根据语音指令采用主动方式或被动方式从预先划分的多个功能领域中确定目标功能领域;
根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令;
可选地,处理器1001可以调用存储器1005中存储的终端控制程序,还执行以下操作:
控制目标应用执行与目标控制指令对应的动作,该目标应用为终端中与目标功能领域对应的应用。
可选地,处理器1001可以调用存储器1005中存储的终端控制程序,还执行以下操作:
当语音指令中存在自定义功能领域唤醒词集合中的任一功能领域唤醒词时,提取语音指令中的目标功能领域唤醒词;
根据预存的功能领域唤醒词与功能领域的映射关系确定目标功能领域唤醒词对应的目标功能领域,该功能领域是根据终端所支持的功能划分的。
可选地,终端内置有域分类引擎,处理器1001可以调用存储器1005中存储的终端控制程序,还执行以下操作:
使用域分类引擎执行多次功能领域分类操作,以从预先划分的多个功能领域中确定目标功能领域。
可选地,处理器1001调用存储器1005中存储的终端控制程序,并执行以下操作:
使用域分类引擎执行第一次功能领域分类操作,以从预先划分的多个功能领域中确定与语音指令对应的参考功能领域;
根据参考功能领域输出领域确认信息,以在接收到基于领域确认信息的反馈信息时,确定与用户意图对应的命中功能领域;
使用域分类引擎执行第二次功能领域分类操作,以将命中功能领域确定为目标功能领域。
可选地,根据参考功能领域输出领域确认信息,以在接收到基于领域确认信息的反馈信息时,确定与用户意图对应的命中功能领域之后,处理器1001可以调用存储器1005中存储的终端控制程序,还执行以下操作:
建立语音指令与命中功能领域的关联信息;
根据关联信息对域分类引擎进行收敛训练,以根据已训练的域分类引擎执行第二次功能领域分类操作;或者,
在下次接收到该语音指令时,根据已训练的域分类引擎执行功能领域分类操作。
可选地,控制目标应用执行与目标控制指令对应的动作之前,处理器1001可以调用存储器1005中存储的终端控制程序,还执行以下操作:
根据目标功能领域内的自然语言处理规则从终端的所有应用中选取与目标功能领域对应的应用。
参照图2,图2为本发明终端控制方法的第一实施例流程图,本实施例中的终端控制方法包括:
步骤s10:终端接收用户的语音指令;
本实施例中,该终端可以是智能电视、智能音箱、智能手机及智能机器人等搭载了语音对话系统的可支持语音控制的智能终端,且该终端可应用于智能家居、自动驾驶及智慧城市等多种应用场景。为了能够准确地识别与响应于用户的语音指令,该终端可包括语音采集装置,该语音采集装置可以是集成在语音对话系统中,也可以是独立于语音对话系统存在于终端中。终端可控制语音采集装置实时采集用户的语音信息,并从所采集的语音信息中识别出用户的语音指令。而从语音信息中识别出用户的语音指令的方式可以是:先对所采集的语音信息进行预处理(如模数转换、滤波和放大等)后,通过asr(automaticspeechrecognition,自动语音识别)将预处理后的语音信息转换为文本信息,然后基于转换后的文本信息运用预先训练好的语音识别模型识别该语音信息中是否存在用户的语音指令或是基于预先设定的语义分析规则分析该语音信息中是否存在用户的语音指令等。其中,语音指令尤指可用于控制终端的指令。在从所采集的语音信息中识别到用户的语音指令时,说明终端接收到用户的语音指令。
然而,在终端接收到用户的语音指令时,该语音指令可能会存在多个与之对应的控制指令,此时无法准确定位用户的真实意图。如,在接收到播放《大约在冬季》的语音指令时,所对应的控制指令可能是播放电影《大约在冬季》,也可能是播放音乐《大约在冬季》,此时,无法定位用户的意图是想看电影还是想听音乐。
步骤s20:终端根据语音指令采用主动方式或被动方式从预先划分的多个功能领域中确定目标功能领域;
为了准确定位用户意图以提高语音控制效果,本实施例提供一种较优的实施方式,终端先根据语音指令从预先划分的多个功能领域中确定目标功能领域(如,电影领域或音乐领域等),然后基于所确定的目标功能领域确定与该语音指令对应的目标控制指令(如,播放电影《大约在冬季》)。
具体地,在确定语音指令对应的功能领域之前,需要先进行功能领域的划分。功能领域的划分过程可以是:先确定终端可执行的功能信息,再根据所确定的功能信息预先划分多个功能领域。其中,终端可执行的功能信息可包括:终端中的应用所能执行的功能信息,而终端中的应用所能执行的功能信息还包括终端中的应用可控制受控设备执行的功能信息,该受控设备尤指终端可控制的设备。然后,根据所确定的功能信息划分功能领域的方式可以是:按照预设划分规则自动划分多个功能领域,也可以是接收用户基于所确定的功能信息触发的设置操作,基于该设置操作划分多个功能领域。其中,预设划分规则可以是:根据执行对象的不同进行划分,如可以是先根据执行对象的不同划分为应用或受控设备两类,然后根据每一类执行对象的功能信息分别在每一类中划分多个功能领域,以便快速查找到功能领域及该功能领域对应的执行对象;也可以是将可控制应用执行的功能信息对应的每一个功能信息都划分为单独的功能领域,以便于提高用户意图定位的准确性等。
接着,在将终端对应的功能信息划分为多个功能领域后,可采用主动方式或被动方式从预先划分的多个功能领域中确定目标功能领域。其中,主动方式可以是预先划分多个功能领域并为每一个功能领域设置相应的唤醒信息,如此,终端便可根据所接收的语音指令自动从预先划分的多个功能领域中确定目标功能领域。如,可先通过机器学习等方式进行聚类分析以生成各功能领域对应的唤醒信息,或者是接收用户的设置指令预先为每一个功能领域设置相应的唤醒信息等,然后将唤醒信息与相应的功能领域关联后存储到数据库中。在终端接收到语音指令时,通过主动识别所接收到的语音指令中的唤醒信息的方式就可以确定与语音指令对应的目标控制领域,该唤醒信息可以是每一个功能领域对应的功能领域唤醒词或是每一个功能领域对应的特征信息等。该被动方式可以是终端与用户交互的方式确定目标功能领域,具体可以是终端在对所接收的语音指令进行初步分析后,根据用户的反馈信息从预先划分的多个功能领域中确定目标功能领域。如,可根据预设分析规则初步分析终端所接收到的语音指令可能对应的功能领域,然后通过文字、图像或语音等方式输出该语音指令可能对应的功能领域,在接收到基于所输出的该语音指令可能对应的功能领域的反馈信息(包括默认的情况)时,可基于该反馈信息被动地确定与语音指令对应的目标控制领域,即使该语音指令可能对应的功能领域只有一个,也需要输出该语音指令可能对应的功能领域,以供用户确认。
步骤s30:终端根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令;
预先为不同功能领域设置相应的自然语言处理规则,于是在确定目标功能领域后,可根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令,根据目标控制指令可控制终端中的应用执行与目标功能领域对应的动作。其中,自然语言处理规则可包括语义分析规则,词法分析规则及句法分析规则等,如在目标功能领域为电影功能领域时,可依据词法分析规则提取语音指令中的名词(如,大约在冬季),分析影视资源库中是否存在与之匹配的资源信息,若存在,则确定目标控制指令为播放影视资源《大约在冬季》;在目标领域为日程领域时,可依据句法分析规则提取语音指令中的时间状语与宾语,如语音指令为我想3点看电影,则提取“3点”“看电影”进行分析,确定目标控制指令为设置3点看电影的日程等。当然,也可以是结合语义分析规则,词法分析规则及句法分析规则等共同分析,以提高分析的准确性。
然而,由于目标功能领域可能对应多条控制指令,如影视功能领域对应的控制指令可包括影视资源库中任一影视资源的播放指令,可先根据目标功能领域内的自然语言处理规则从目标功能领域对应的多个控制指令中确定目标控制指令,如在语音指令中包含《大约在冬季》,且目标功能领域为影视功能领域时,通过与影视功能领域的影视资源库中的资源信息匹配确定目标控制指令为播放电影《大约在冬季》。
此外,一实施例中,在确定目标控制指令后,终端可控制目标应用执行与目标控制指令对应的动作,其中,目标应用为终端中与目标功能领域对应的应用。因而,在终端中具备多个目标功能领域对应的应用时,如,若终端为电视机,则电视机既可控制电视机中影视功能领域对应的影视播放应用执行影视资源播放动作,也可控制电视机中音乐功能领域对应的音乐播放应用执行音乐资源播放动作等。于是,在电视机接收到的目标控制指令为影视播放指令时,控制电视机中的影视播放应用执行播放影视资源的动作;在目标控制指令为音乐播放指令时,可控制电视机中的音乐播放应用执行播放音乐资源的动作等。另外,若终端应用于智能家居等场景,如电视机与空调器连接,且电视机为智能家居系统的控制终端,则在电视机接收到调节温度至25℃的目标控制指令时,可控制电视机中与空控制应用向空调器发送温度调节的控制指令,以控制空调器将温度调节至25℃。
当然,在终端无需调用应用时,也可直接执行与目标控制指令相应的动作。如,在终端为空调器时,若空调器接收到“调节温度至25℃”的目标控制指令,则空调器可直接响应于目标控制指令将温度调节至25℃。即,目标控制指令可能是终端执行也可能是终端中与目标功能领域对应的应用执行。
另一实施例中,在控制目标应用执行与目标控制指令对应的动作之前,先要根据目标功能领域内的自然语言处理规则从终端的所有应用中选取出与目标功能领域对应的应用,也即先要选取出目标应用,才能控制目标应用执行与目标控制指令对应的动作。具体可以是:基于不同应用的功能特性预先为终端中的不同应用设置相应的功能关键词,然后根据目标功能领域内的自然语言处理规则对语音指令进行分析,并将分析结果与不同应用的关键词及不同应用可执行的资源信息库进行匹配,从而从终端的所有应用中确定与目标功能领域对应的应用。如,在语音指令为“播放大约在冬季”,且所确定的目标功能领域为影视功能领域时,可利用影视功能领域的自然语言处理规则先分析播放功能对应的应用有哪些,然后从分析得到的应用中筛选出资源信息库中包含“大约在冬季”的应用,也即可利用影视功能领域的自然语言处理规则中的匹配规则,可匹配出具有“播放”功能,且资源信息库中包含“大约在冬季”资源的应用作为影视功能领域对应的应用。
然而,在一些特殊情况下,如目标功能领域对应多个应用,这多个应用可执行同一目标控制指令对应的动作时,由于终端同一时间只能控制一个应用执行与目标控制指令对应的动作,还需要进一步从目标功能领域对应的多个应用中确定与用户意图对应的目标应用,然后控制与用户意图对应的目标应用执行目标控制指令对应的动作。具体地,可先基于所确定的目标功能领域从终端的所有应用中确定该目标功能领域对应的多个应用,然后基于目标功能领域内的自然语言处理规则中预先设定的优先级规则从目标功能领域对应的多个应用中确定与用户意图对应的目标应用;还可以是根据目标功能领域内的自然语言处理规则与用户交互以从目标功能领域对应的多个应用中确定与用户意图对应的目标应用等。如,在终端为电视机时,若电视机接收到影视资源播放指令,则该影视资源播放指令可以是由电视机上安装的影视播放应用执行,也可以是由电视机上与智能音箱对应的控制应用来控制智能音箱执行等。若依据预先设定的优先级来确定执行影视资源播放指令的目标应用,则在电视机中影视功能领域下的应用包括第一影视播放应用,第二影视播放应用及与智能音箱对应的控制应用时,若预先设定的优先级从高到低依次为第一影视播放应用,第二影视播放应用及与智能音箱对应的控制应用,则可根据所设定的优先级确定第一影视播放应用为执行影视资源播放指令的目标应用,在第一影视播放应用不存在与影视资源播放指令对应的播放资源时,则将第二影视播放应用确定为执行影视资源播放指令的目标应用,依此类推;其中,第一影视播放应用,第二影视播放应用可以是电视机安装的任一影视播放应用,智能音箱对应的控制应用可以是电视机安装的可控制其他设备播放影视的应用,这里不做具体限定;若是根据目标功能领域内的自然语言处理规则与用户交互以从终端的应用中确定目标应用,则可先依据目标功能领域内的自然语言处理规则确定与目标控制指令匹配的信息资源库,然后依据所确定的信息资源库确定信息资源库对应的应用,基于所确定的应用与用户进行交互,如在匹配的应用包括第一影视播放应用和第二影视播放应用时,则可与用户交互,如询问客户“您是想通过第一影视播放应用还是第二影视播放应用进行播放”,在接收到用户的反馈信息为第一影视播放应用时,将第一影视播放应用确定为执行影视资源播放指令的目标应用;在接收到用户的反馈信息为第二影视播放应用时,将第二影视播放应用确定为执行影视资源播放指令的目标应用;当然,在用户的反馈信息为智能音箱对应的控制应用时,也可将智能音箱对应的控制应用确定为执行影视资源播放指令的目标应用。
本实施例通过接收用户的语音指令,先根据语音指令采用主动方式或被动方式从预先划分的多个功能领域中确定目标功能领域,然后根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令,使得终端能够控制终端中与目标功能领域对应的应用执行与目标控制指令对应的动作。通过功能领域的划分,先采用主动方式或被动方式确定目标领域再基于目标功能领域确定与语音指令对应的目标控制指令,避免直接确定语音指令对应的控制指令无法准确定位用户意图导致语音控制效果较差影响用户体验感,提高了语音控制的准确性,且提升了用户体验感。
参照图3,图3为本发明终端控制方法的第二实施例流程图,基于上述第一实施例提出本发明终端控制方法的第二实施例。本实施例中的终端控制方法包括:
步骤s11:终端接收用户的语音指令;
步骤s12:当语音指令中存在自定义功能领域唤醒词集合中的任一功能领域唤醒词时,终端提取语音指令中的目标功能领域唤醒词;
步骤s13:终端根据预存的功能领域唤醒词与功能领域的映射关系确定目标功能领域唤醒词对应的目标功能领域,该功能领域是根据终端所支持的功能划分的;
步骤s14:终端根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令;
步骤s15:终端控制目标应用执行与目标控制指令对应的动作,该目标应用为终端中与目标功能领域对应的应用。
本实施例中,在终端接收到用户的语音指令后,可根据语音指令采用主动方式从预先划分的多个功能领域中确定目标功能领域。具体地,可预先划分多个功能领域,并为划分后的每一个功能领域设置相应的功能领域唤醒词,以形成自定义功能领域唤醒词集合,即自定义功能领域唤醒词集合中包括不同功能领域对应的功能领域唤醒词,并预先建立功能领域唤醒词与相应功能领域的映射关系。于是,用户只需说出包含自定义功能领域唤醒词集合中的任一功能领域唤醒词的语音指令便可以快速确定与语音指令对应的目标功能领域,进而根据目标功能领域内的自然语言处理规则准确确定与语音指令对应的目标控制指令,并且还可以控制终端中目标功能领域对应的目标应用执行与目标控制指令对应的动作,其中,功能领域的划分是依据终端所支持的功能划分的,所支持的功能类型可包括音乐类型、影视类型、天气类型、日程类型和设备控制类型等。
于是,根据语音指令采用主动方式从预先划分的多个功能领域中确定目标功能领域的方式可以是:先提取语音指令中的目标功能领域唤醒词,然后根据预存的功能领域唤醒词与功能领域的映射关系确定目标功能领域唤醒词对应的目标功能领域。如,在预先划分的多个功能领域包括:影视功能领域、音乐功能领域、天气功能领域及空调功能领域时,可根据用户喜好等预先设置“影子”为影视功能领域对应的功能领域唤醒词,“鸽子”为音乐功能领域对应的功能领域唤醒词,“李秘书”为天气功能领域对应的功能领域唤醒词,“空调”为空调功能领域对应的功能领域唤醒词,则可形成包含“影子、鸽子、李秘书及空调”的自定义功能领域唤醒词集合,并形成“影子”与影视功能领域对应,“鸽子”与音乐功能领域对应,“李秘书”与天气功能领域对应且“空调”与空调功能领域对应的映射关系。当识别出终端所接收的语音指令中包含“影子”这一功能领域唤醒词时,可先从语音指令中提取该目标功能领域唤醒词“影子”,然后根据预先存储的映射关系确定目标功能领域唤醒词“影子”对应的目标功能领域为影视功能领域;在识别出终端所接收的语音指令中包含“鸽子”这一功能领域唤醒词时,可先从语音指令中提取目标功能领域唤醒词“鸽子”,然后根据预先存储的映射关系确定“鸽子”对应的目标功能领域为音乐功能领域;在识别出终端所接收的语音指令中包含“李秘书”这一功能领域唤醒词时,可先从语音指令中提取目标功能领域唤醒词“李秘书”,然后根据预先存储的映射关系确定“李秘书”对应的目标功能领域为天气功能领域;在识别出终端所接收的语音指令中包含“空调”这一功能领域唤醒词时,可先从语音指令中提取目标功能领域唤醒词“空调”,然后根据预先存储的映射关系确定“空调”对应的目标功能领域为空调功能领域。
此外,在根据功能领域唤醒词从预先划分的多个功能领域中确定目标功能领域之后,还可根据目标功能领域对应的语音指令的历史唤醒情况进行学习成长,即可将目标功能领域对应的语音指令进行特征学习,以学习该目标功能领域对应的语音指令的特征信息。如此,下次用户无需说出功能领域唤醒词,只需说出具备该特征信息的语音指令即可。即,在接收到无功能领域唤醒词的语音指令时,若语音指令包含所学习的特征信息,则可直接根据该特征信息确定与该语音指令对应的目标功能领域。如,若监测到用户经常说“杨秘书,3点扫地”“杨秘书,5点我要出门”,由于杨秘书为日程功能对应的功能领域唤醒词,在识别到“(几)点(做某事)”的句式时,系统通过学习,可以确定“(几)点(做某事)”为日程领域的常用句式,将其作为特征样本进行特征学习。那么,在下次匹配到该句式(包含学习后的特征信息),如“5点看电影”时,可以直接确定相应的目标领域为日程领域,而无需用户说出“杨秘书”这一唤醒词。
在终端根据预存的功能领域唤醒词与功能领域的映射关系确定目标功能领域唤醒词对应的目标功能领域之后,一方面,终端可根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令,准确定位用户意图;另一方面,在确定目标控制指令(即定位用户意图)之后,终端还可控制终端控制目标功能领域对应的应用执行与目标控制指令对应的动作,更加准确地响应于用户的语音指令,从而提高语音控制的控制效果。
本实施例中终端通过接收用户的语音指令,当语音指令中存在自定义功能领域唤醒词集合中的任一功能领域唤醒词时,提取语音指令中的目标功能领域唤醒词,然后根据预存的功能领域唤醒词与功能领域的映射关系确定目标功能领域唤醒词对应的目标功能领域,接着根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令,再控制终端中的目标应用执行与目标控制指令对应的动作。即,通过提取语音指令中的功能领域唤醒词能够快速确定目标功能领域,并且更加快速和准确地确定与用户意图对应的目标控制指令,提高语音控制的响应速度与响应的准确性,从而提高语音控制效果,提升用户体验感。
参照图4,图4为本发明终端控制方法的第三实施例流程图,本实施例中的终端控制方法包括:
步骤s21:终端接收用户的语音指令;
步骤s22:终端使用域分类引擎执行多次功能领域分类操作,以从预先划分的多个功能领域中确定目标功能领域;
步骤s23:终端根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令;
步骤s24:终端控制目标应用执行与目标控制指令对应的动作,目标应用为终端中与目标功能领域对应的应用。
本实施例中,在终端接收到用户的语音指令后,可根据语音指令采用被动方式从预先划分的多个功能领域中确定目标功能领域。其中,终端内置有域分类引擎,该域分类引擎中包含预先设定的分类规则,根据预先设定的分类规则执行多次功能领域分类操作,可以从预先划分的多个功能领域中确定目标功能领域。
具体地,预先设定的分类规则可包括基于自然语义分析确定的语义分类规则和基于用户反馈信息确定的反馈分类规则。为了从预先划分的多个功能领域中确定目标功能领域,可先基于语义分类规则初步确认可能与语音指令对应的功能领域,即可先使用域分类引擎执行第一次功能领域分类操作,以从预先划分的多个功能领域中确定语音指令对应的参考功能领域;然后可根据参考功能领域生成领域确认信息并输出,以在接收到基于领域确认信息的反馈信息时,确定与用户意图对应的命中功能领域,接着可以基于反馈分类规则使用域分类引擎执行第二次功能领域分类操作,以将命中功能领域确定为目标功能领域。如此,在参考领域只包含一个功能领域时,可直接输出领域确认信息以询问用户该功能领域是否为用户意图对应的功能领域,如在参考功能领域只包含电影功能领域时,输出语音信息“你是想看电影吗”,以供用户确认是否想看电影。若接收到用户的反馈信息为“是”或“对”等,则确定与用户意图对应的功能领域为电影功能领域,并将电影功能领域确定为目标功能领域;当然在电影功能领域并非用户意图对应的功能领域时,若接收到用户的反馈信息为“我想听音乐”也可以重新确定与用户意图对应的功能领域为音乐功能领域;或者,在预设时间内未接收到用户的反馈信息时,也可默认用户意图对应的功能领域为电影功能领域。在参考功能领域包含多个功能领域(如包含电影、音乐及日程等)时,可基于参考功能领域生成领域确认信息“电影、音乐还是日程”并输出,若接收到的反馈信息为“电影”,则将电影功能领域确定为目标功能领域;或者,按照一定的优先级逐个功能领域进行询问,如“你是想看电影吗”,若用户回答“不是”,则继续询问“你是想听音乐吗”,此时需要与用户进行多轮交互才能最终确定目标功能领域。若参考功能领域不包含与用户意图对应的功能领域,则需要基于本次的分类情况对域分类引擎中的预设分类规则进行更新后重新执行多次功能领域分类操作以最终确定目标功能领域,或是直接根据用户的反馈信息确定目标功能领域,如用户的反馈信息为“日程”,则确定与用户意图对应的功能领域为日程功能领域,将日程功能领域确定为目标功能领域。
此外,在一实施例中,为了减少域分类引擎执行功能领域分类操作的次数以提高系统的处理效率且提高域分类引擎执行功能领域分类操作的准确性,在确定与用户意图对应的命中功能领域之后,还会对域分类引擎进行收敛训练,训练样本即语音指令与其对应的命中功能领域的关联信息。即,在确定与用户意图对应的命中功能领域之后,本实施例还会建立语音指令与其对应的命中功能领域的关联信息,然后根据该关联信息对域分类引擎进行收敛训练,再根据已训练的域分类引擎执行第二次功能领域分类操作,以将命中功能领域确定为目标功能领域;并且,在下次接收到语音指令时,根据已训练的域分类引擎执行功能领域分类操作可以有效减少执行功能领域分类操作的次数,从而快速确定目标功能领域。如,在接收到“大约在冬季”的语音指令时,若此次确定语音指令对应的目标功能领域为电影功能领域,则在域分类引擎对应的分类规则中将“大约在冬季”对应的电影功能领域的权重加一,下次接收到“大约在冬季”的语音指令时,就会根据调整后的权重再来确定该语音指令对应的目标功能领域,可以提高根据语音指令确定目标功能领域的准确性。
在终端使用域分类引擎执行多次功能领域分类操作,以从预先划分的多个功能领域中确定目标功能领域之后,一方面,终端可根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令,准确定位用户意图;另一方面,在确定目标控制指令(即定位用户意图)之后,终端还可控制终端控制目标功能领域对应的应用执行与目标控制指令对应的动作,更加准确地响应于用户的语音指令,从而提高语音控制的控制效果。
本实施例通过接收用户的语音指令,并使用域分类引擎执行多次功能领域分类操作,以从预先划分的多个功能领域中确定目标功能领域,然后根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令,再控制终端中与目标功能领域对应的应用执行与目标控制指令对应的动作。即,通过域分类引擎执行多次功能领域分类操作,可从预先划分的多个功能领域中确定目标功能领域,避免直接通过语义分析确定目标控制指令无法准确定位用户意图,提高了用户意图定位的准确性,且提升了语音控制效果与用户体验感。
参照图5,图5为本发明终端控制方法的第四实施例流程图,本实施例中的终端控制方法包括以下步骤:
步骤s31:终端接收用户的语音指令;
步骤s32:终端判断语音指令中是否存在自定义功能领域唤醒词集合中的功能领域唤醒词;
步骤s33:若存在,则终端提取语音指令中的目标功能领域唤醒词;
步骤s34:终端根据预存的功能领域唤醒词与功能领域的映射关系确定目标功能领域唤醒词对应的目标功能领域,该功能领域是根据终端所支持的功能划分的;
步骤s35:若不存在,则终端使用域分类引擎执行多次功能领域分类操作,以从预先划分的多个功能领域中确定目标功能领域;
步骤s36:终端根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令;
步骤s37:终端控制目标应用执行与目标控制指令对应的动作,该目标应用为终端中与目标功能领域对应的应用。
本实施例中,在接收到用户的语音指令时,需要先判断语音指令中是否存在自定义功能领域唤醒词集合中的功能领域唤醒词;若语音指令中存在自定义功能领域唤醒词集合中的功能领域唤醒词,则可将语音指令中的功能领域唤醒词作为目标功能领域唤醒词,先提取语音指令中的目标功能领域唤醒词,然后根据预存的功能领域唤醒词与功能领域的映射关系确定目标功能领域唤醒词对应的目标功能领域;若语音指令中不存在自定义功能领域唤醒词集合中的功能领域唤醒词,则可使用域分类引擎执行多次功能领域分类操作,以从预先划分的多个功能领域中确定目标功能领域。即,本实施例中优选通过语音指令中的目标功能领域唤醒词来确定目标功能领域,在语音指令中不存在目标功能领域唤醒词时,才通过域分类引擎执行多次功能领域分类操作来确定目标功能领域。也即,本实施例中终端预先存储有两套应用程序用于确定目标功能领域,其中一套是根据目标功能领域唤醒词采用主动方式确定目标功能领域,另一套是通过域分类引擎采用被动方式确定目标功能领域,其中,根据目标功能领域唤醒词采用主动方式确定目标功能领域的优先级高于通过域分类引擎采用被动方式确定目标功能领域的优先级。
至于根据预存的功能领域唤醒词与功能领域的映射关系确定目标功能领域唤醒词对应的目标功能领域的具体方式与使用域分类引擎执行多次功能领域分类操作,以从预先划分的多个功能领域中确定目标功能领域的具体方式可参照本发明终端控制方法的第二实施例和第三实施例,此处不再赘述。
本实施例在接收用户的语音指令后,先判断语音指令中是否存在自定义功能领域唤醒词集合中的功能领域唤醒词,若语音指令中存在自定义功能领域唤醒词集合中的功能领域唤醒词,则提取语音指令中的目标功能领域唤醒词,并根据预存的功能领域唤醒词与功能领域的映射关系确定目标功能领域唤醒词对应的目标功能领域,其中,功能领域是根据终端所支持的功能划分的;若语音指令中不存在自定义功能领域唤醒词集合中的功能领域唤醒词,则使用域分类引擎执行多次功能领域分类操作,以从预先划分的多个功能领域中确定目标功能领域。即,通过判断语音指令中是否存在自定义功能领域唤醒词集合中的功能领域唤醒词,使得在语音指令中存在目标功能领域时,根据功能领域唤醒词快速从预先划分的多个功能领域中确定目标功能领域;而在语音指令中不存在目标功能领域时,才运用域分类引擎执行多次功能领域分类操作确定目标功能领域,使得无论有误唤醒词均可以准确定位用户意图,且优先根据功能领域唤醒词确定目标功能领域,有利于提高处理速度。
此外,本发明实施例还提供一种终端控制装置,参照图6,图6为本终端控制装置一实施例的功能模块示意图。
本实施例中,终端控制装置包括:
接收单元10:用于接收用户的语音指令;
第一确定单元20:用于根据语音指令采用主动方式或被动方式从预先划分的多个功能领域中确定目标功能领域;
第二确定单元30:用于根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令。
需要说明的是,该终端控制装置的各个实施例与上述终端控制方法的各实施例基本相同,在此不再详细赘述。
本实施例提出的终端控制装置,通过接收单元10接收用户的语音指令,接着第一确定单元20根据语音指令采用主动方式或被动方式从预先划分的多个功能领域中确定目标功能领域,而后第二确定单元30根据目标功能领域内的自然语言处理规则确定与语音指令对应的目标控制指令,即在采用主动方式或被动方式确定目标功能领域之后,基于目标功能领域确定与语音指令对应的目标控制指令,避免直接确定语音指令对应的控制指令无法准确定位用户意图导致语音控制效果较差,提高了语音控制的准确性,且提升了用户体验感。
此外,本发明实施例还提供一种智能终端,该智能终端可以是智能电视、智能音箱、智能手机及智能机器人等搭载了语音对话系统的可支持语音唤醒与控制的终端,可应用于智能家居、自动驾驶及智慧城市等多种应用场景。并且,该智能终端包括存储器、处理器及存储在处理器上并可在处理器上运行的终端控制程序,处理器执行终端控制程序时实现上述终端控制方法的步骤。
此外,本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有终端控制程序,该终端控制程序被处理器执行时实现上述终端控制方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,电视,或者网络设备等)执行本发明各个实施例的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除