一种语音控制方法、装置、电器设备、存储介质及处理器与流程
本发明属于语音技术领域,具体涉及一种语音控制方法、装置、电器设备、存储介质及处理器,尤其涉及一种实现全双工和半双工结合的语音识别方法、装置、电器设备、存储介质及处理器。
背景技术:
随着语音控制的电器设备(如语音空调)的普及推广,使用语音空调的用户数量持续增加。但语音空调的智能化程度仍然比较低,影响了用户的使用体验。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
技术实现要素:
本发明的目的在于,提供一种语音控制方法、装置、电器设备、存储介质及处理器,以解决语音控制的智能化程度仍然比较低从而影响用户的使用体验的问题,达到提升语音控制的智能化程度从而提升用户体验的效果。
本发明提供一种语音控制方法,包括:采集语音数据;对所述语音数据进行分析,得到所述语音数据的上下文关系;确定所述语音数据的上下文关系是否已达到当前领域下设定阈值;若所述语音数据的上下文关系已达到所述设定阈值,则确定电器设备在当前领域下的工作模式为全双工工作模式;若所述语音数据的上下文关系未达到所述设定阈值,则确定电器设备在当前领域下的工作模式为半双工工作模式。
可选地,所述当前领域,包括:信息获取领域、控制领域中的任一领域;其中,在所述信息获取领域下,电器设备在本地端通过语音板分析所述语音数据下发的信息获取指令、并调用本地端预先下载并存储的待获取信息,或接收由云端通过分析所述语音数据下发的信息获取指令、以及由云端通过互联网资源收集并下发的待获取信息,并控制电器设备按所述信息获取指令为使用者提供待获取信息;在所述控制领域下,电器设备在本地端通过语音板分析所述语音数据下发的控制指令,或接收由云端通过分析所述语音数据下发的控制指令,并按所述控制指令控制电器设备为用户提供服务。
可选地,所述语音数据,包括:语音指令和/或语音需求;所述采集语音数据,包括:通过麦克风模块,采集使用者发出的语音指令、和/或使用者说出的语音需求。
可选地,对所述语音数据进行分析,包括:对所述语音数据进行语义分析,以提取所述语音数据所包含的一个以上关键词;根据设定关键词与设定值之间的对应关系,将该对应关系中与每个关键词相同的设定关键词所对应的设定值确定为每个关键词的值;对一个以上关键词的值进行加权求平均值和归一化处理,得到一个以上关键词的平均值,将该平均值作为所述语音数据的上下文关系。
可选地,其中,对所述语音数据进行分析的执行端,包括:语音板或云端;在云端作为对所述语音数据进行分析的执行端的情况下,由电器设备的语音板在本地端将所述语音数据转换为文本信息后,将所述文本信息上传至云端;之后再由语音板接收云端对所述语音数据进行分析后下发的所述语音数据的上下文关系。
可选地,还包括:在确定电器设备在当前领域下的工作模式为全双工工作模式之后,根据所述语音数据确定使用者的使用习惯;根据接收由云端通过分析所述语音数据下发的信息获取指令和控制指令中任一指令,并结合所述使用习惯,调整电器设备在当前领域下的工作状态和/或工作时长。
可选地,还包括:在确定电器设备在当前领域下的工作模式为全双工工作模式之后,若所述语音数据所包含的控制指令为信息获取指令和控制指令中两个以上指令,则根据使用者的使用习惯确定两个以上指令的优先级,并按确定的优先级执行两个以上指令。
与上述方法相匹配,本发明另一方面提供一种语音控制装置,包括:采集单元,用于采集语音数据;分析单元,用于对所述语音数据进行分析,得到所述语音数据的上下文关系;控制单元,用于确定所述语音数据的上下文关系是否已达到当前领域下设定阈值;所述控制单元,还用于若所述语音数据的上下文关系已达到所述设定阈值,则确定电器设备在当前领域下的工作模式为全双工工作模式;所述控制单元,还用于若所述语音数据的上下文关系未达到所述设定阈值,则确定电器设备在当前领域下的工作模式为半双工工作模式。
可选地,所述当前领域,包括:信息获取领域、控制领域中的任一领域;其中,在所述信息获取领域下,电器设备在本地端通过语音板分析所述语音数据下发的信息获取指令、并调用本地端预先下载并存储的待获取信息,或接收由云端通过分析所述语音数据下发的信息获取指令、以及由云端通过互联网资源收集并下发的待获取信息,并控制电器设备按所述信息获取指令为使用者提供待获取信息;在所述控制领域下,电器设备在本地端通过语音板分析所述语音数据下发的控制指令,或接收由云端通过分析所述语音数据下发的控制指令,并按所述控制指令控制电器设备为用户提供服务。
可选地,所述语音数据,包括:语音指令和/或语音需求;所述采集单元采集语音数据,包括:通过麦克风模块,采集使用者发出的语音指令、和/或使用者说出的语音需求。
可选地,所述分析单元对所述语音数据进行分析,包括:对所述语音数据进行语义分析,以提取所述语音数据所包含的一个以上关键词;根据设定关键词与设定值之间的对应关系,将该对应关系中与每个关键词相同的设定关键词所对应的设定值确定为每个关键词的值;对一个以上关键词的值进行加权求平均值和归一化处理,得到一个以上关键词的平均值,将该平均值作为所述语音数据的上下文关系。
可选地,其中,所述分析单元对所述语音数据进行分析的执行端,包括:语音板或云端;在云端作为对所述语音数据进行分析的执行端的情况下,由电器设备的语音板在本地端将所述语音数据转换为文本信息后,将所述文本信息上传至云端;之后再由语音板接收云端对所述语音数据进行分析后下发的所述语音数据的上下文关系。
可选地,还包括:所述控制单元,还用于在确定电器设备在当前领域下的工作模式为全双工工作模式之后,根据所述语音数据确定使用者的使用习惯;所述控制单元,还用于根据接收由云端通过分析所述语音数据下发的信息获取指令和控制指令中任一指令,并结合所述使用习惯,调整电器设备在当前领域下的工作状态和/或工作时长。
可选地,还包括:所述控制单元,还用于在确定电器设备在当前领域下的工作模式为全双工工作模式之后,若所述语音数据所包含的控制指令为信息获取指令和控制指令中两个以上指令,则根据使用者的使用习惯确定两个以上指令的优先级,并按确定的优先级执行两个以上指令。
与上述装置相匹配,本发明再一方面提供一种电器设备,包括:以上所述的语音控制装置。
与上述方法相匹配,本发明再一方面提供一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行以上所述的语音控制方法。
与上述方法相匹配,本发明再一方面提供一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行以上所述的语音控制方法。
由此,本发明的方案,通过对采集到的语音数据进行识别,根据识别结果确定该语音数据所对应的语音指令是工作于全双工工作模式还是半双工工作模式,可以避免所有的语音指令都工作于全双工工作模式,解决语音控制的智能化程度仍然比较低从而影响用户的使用体验的问题,达到提升语音控制的智能化程度从而提升用户体验的效果。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明的语音控制方法的一实施例的流程示意图;
图2为本发明的方法中对所述语音数据进行分析的一实施例的流程示意图;
图3为本发明的方法中根据使用习惯对不同领域下的工作状态进行调整的一实施例的流程示意图;
图4为本发明的语音控制装置的一实施例的结构示意图;
图5为空调(如语音空调)的一实施例的实现全双工和半双工结合的语音识别的流程示意图。
结合附图,本发明实施例中附图标记如下:
102-采集单元;104-分析单元;106-控制单元。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明的实施例,提供了一种语音控制方法,如图1所示本发明的方法的一实施例的流程示意图。该语音控制方法可以应用在具有语音控制功能的电器设备如语音空调、语音电视等上,适用所有语音智能产品,语音工作模式可以在全双工模式和半双工模式之间自动选择切换,能够智能调节语音识别时长,以在特定领域下对语音识别时间进行智能判断和自动调整。其中,电器设备的语音控制方法,可以包括:步骤s110至步骤s150。
步骤s110,采集语音数据。例如:采集语音空调所在房间内的语音数据。
可选地,所述语音数据,可以包括:语音指令和/或语音需求。
步骤s110中所述采集语音数据,可以包括:通过麦克风模块,采集使用者发出的语音指令、和/或使用者说出的语音需求。
例如:可以通过空调麦克风采集用户的使用数据,具体可以是采集用户的说话习惯。如通过麦克风采集用户发出的指令或者用户说出的需求。
由此,通过麦克风采集多种形式的语音数据,可以提升对语音数据采集的全面性,进而可以根据全面采集到的语音数据进行语音控制,不仅保证了对用户需求的满足,还避免了对非用户需求语音的执行而浪费资源并给用户造成困扰。
步骤s120,对所述语音数据进行分析,得到所述语音数据的上下文关系。
可选地,可以结合图2所示本发明的方法中对所述语音数据进行分析的一实施例流程示意图,进一步说明步骤s120中对所述语音数据进行分析的具体过程,可以包括:步骤s210至步骤s230。
步骤s210,对所述语音数据进行语义分析,以提取所述语音数据所包含的一个以上关键词。
步骤s220,根据设定关键词与设定值之间的对应关系,将该对应关系中与每个关键词相同的设定关键词所对应的设定值确定为每个关键词的值。
例如:在新闻领域中,语音数据可以是“我想听热门新闻”,提取的关键词可以是“热门新闻”,以进入新闻领域并下发热门新闻链接到空调端。在设定的对应关系中,与“热门新闻”对应的设定值可以是一个数值范围比如3-5,也可以是一个具体的数值比如5。
例如:在笑话领域中,语音数据可以是“我想听笑话”,提取的关键词可以是“笑话”,以进入笑话领域并下发笑话链接到空调端。在设定的对应关系中,与“笑话”对应的设定值可以是一个数值范围比如6-8,也可以是一个具体的数值比如6。
例如:在控制领域中,语音数据可以是“打开上下扫风”,提取的关键词可以是“上下扫风”,以进入控制领域以及下发打开相关上下扫风的协议,通过协议下发到空调并控制空调。在设定的对应关系中,与“上下扫风”对应的设定值可以是一个数值范围比如10-15,也可以是一个具体的数值比如12。
步骤s230,对一个以上关键词的值进行加权求平均值和归一化处理,得到一个以上关键词的平均值,将该平均值作为所述语音数据的上下文关系,即作为所述语音数据所对应的值。
例如:用户语音指令的上下文关系,可以包括:提取指令的语义,可以通过自然语言模块处理得到。语音板采集到的用户数据为几个语句,每个语句中有关键词,每个关键词被赋予相应的值如数值。对这几个语句中的几个关键词的值进行加权平均值、归一化等处理,得到平均值,该平均值可以表示这几句话所包含的语音指令的上下文关系。若该平均值达到设定阈值,则表示这几句话所包含的语音指令的上下文关系的关系性强。
由此,通过语义分析来提取关键词,并确定关键词的平均值的方式确定语音数据的上下文关系,使得对某一时段采集的语音数据进行综合处理来准确把握用户需求,有利于提高语音控制的智能化程度。
其中,对所述语音数据进行分析的执行端,可以包括:语音板或云端。
在云端作为对所述语音数据进行分析的执行端的情况下,由电器设备的语音板在本地端将所述语音数据转换为文本信息后,将所述文本信息上传至云端;之后再由语音板接收云端对所述语音数据进行分析后下发的所述语音数据的上下文关系。
例如:在用户使用语音空调的时候,同步采集用户的使用数据,并把采集到的用户的使用数据发送到云端进行分析和处理。如可以通过麦克风采集数据,然后通过语音板中的语音模块生成文本上传到云端,云端分析文本,通过自然语音处理进行分析文本,分析出来的结果进行处理并下发到语音板。
由此,通过多个执行端对语音数据进行分析,可以在网络连接状态和网络断开状态下均实现语音控制,方便用户使用。
步骤s130,确定所述语音数据的上下文关系是否已达到当前领域下设定阈值。
其中,所述当前领域,可以包括:信息获取领域(如新闻领域、笑话领域等)、控制领域中的任一领域。每个领域下的设定阈值可以相同。
具体地,在所述信息获取领域下,电器设备在本地端通过语音板分析所述语音数据下发的信息获取指令、并调用本地端预先下载并存储的待获取信息,或接收由云端通过分析所述语音数据下发的信息获取指令、以及由云端通过互联网资源收集并下发的待获取信息,并控制电器设备按所述信息获取指令为使用者提供待获取信息。
例如:在所述新闻领域下,电器设备在本地端通过语音板分析所述语音数据下发的第一信息获取指令、并调用本地端预先下载并存储的新闻消息,或接收由云端通过分析所述语音数据下发的第一信息获取指令、以及由云端通过互联网资源收集并下发的新闻消息,并控制电器设备按所述第一信息获取指令为使用者提供新闻消息。
又如:在所述笑话领域下,电器设备在本地端通过语音板分析所述语音数据下发的第二信息获取指令、并调用本地端预先下载并存储的娱乐消息(如笑话消息),或接收由云端通过分析所述语音数据下发的第二信息获取指令、以及由云端通过互联网资源收集并下发的娱乐消息(如笑话消息),并控制电器设备按所述第二信息获取指令为使用者提供娱乐消息(如笑话消息)。
具体地,在所述控制领域下,电器设备在本地端通过语音板分析所述语音数据下发的控制指令,或接收由云端通过分析所述语音数据下发的控制指令,并按所述控制指令控制电器设备为用户提供服务。
例如:语音空调预先设定每个支持领域下的语音的工作模式。语音空调的支持领域,可以包括:按互联网资源类分为新闻领域、笑话领域、空调控制领域。工作模式:就是处在各领域下的运行状态,如全双工工作模式或半双工工作模式。
例如:通过用户的指令在语音板生成文本上传到云端,然后通过自然语音模块进行分析文本语义并判断用户需求,通过分析出的语义切换到不同的领域和需求并下发的空调端。
由此,通过对多个领域进行语音智能控制,可以方便不同控制需求的用户使用,适用范围广,用户体验好。
步骤s140,若所述语音数据的上下文关系已达到所述设定阈值,则确定电器设备在当前领域下的工作模式为全双工工作模式。
步骤s150,若所述语音数据的上下文关系未达到所述设定阈值,则确定电器设备在当前领域下的工作模式为半双工工作模式。
例如:采集语音空调所在环境中的语音数据,对采集到的语音数据进行识别,根据识别结果确定语音空调是工作在全双工工作模式还是半双工工作模式,可以避免误识别,有利于提升语音空调的智能化程度,进而提升用户的使用体验。
例如:在动态地调整语音空调工作在某个领域的全双工和半双工工作模式时,可以采用语音指令的上下文关系,若关系性强(如关系性达到某个阈值),通过设定的阈值动态设置全双工识别和半双工识别。这样,可以智能判断用户的语音指令数据,判断语音指令的上下文关系,若关系性强(如关系性达到某个阈值),则自动划分为全双工识别场景;否则若关系性不强(如关系性未达到某个阈值),则划分为半双工识别场景,从而达到动态调节识别场景工作模式的目的,可以减少误唤醒和误识别的情况发生,提高识别率。
由此,通过一种实现全双工和半双工结合的语音识别方案,能够实现语音空调工作模式的动态自动切换和选择,即动态地调整语音空调工作在某个领域的全双工和半双工工作模式,可以提高全领域下语音空调用户的识别率和提升语音空调的智能化水平。
在一个可选实施方式中,还可以包括:根据使用习惯对不同领域下的工作状态进行调整的过程。
下面结合图3所示本发明的方法中根据使用习惯对不同领域下的工作状态进行调整的一实施例流程示意图,进一步说明根据使用习惯对不同领域下的工作状态进行调整的具体过程,可以包括:步骤s310和步骤s320。
步骤s310,在确定电器设备在当前领域下的工作模式为全双工工作模式之后,根据所述语音数据确定使用者的使用习惯。
步骤s320,根据接收由云端通过分析所述语音数据下发的信息获取指令(如第一信息获取指令、第二信息获取指令等)和控制指令中任一指令,并结合所述使用习惯,调整电器设备在当前领域下的工作状态和/或工作时长,以按使用者的使用习惯为使用者提供服务。
例如:重新对每个领域工作模式进行调整。具体地,根据用户使用习惯数据,智能判断用户在该领域下的使用习惯。通过采集到的用户语音指令的上下文关系(即用户上下文语音指令的关联性关系),若关系性强(如达到某个阈值)则判断在该领域下该用户的使用习惯是适合于全双工工作模式,否则为半双工工作模式。如根据用户使用习惯数据,智能判断用户在该领域下的使用习惯,可以包括:可以通过用户指令通用自然语音处理进行上下文分析语义,并判断处于哪个领域,并对用户使用习惯进行统计。
例如:每个领域下全双工工作模式的识别时长,可以根据收集到的用户数据进行智能判断,之后再退出对该领域下全双工工作模式的时长识别过程。具体地,若语音空调工作在全双工工作模式下,可以根据实时采集到的用户使用数据,推测出用户的使用习惯、或判断用户的使用习惯,进而根据用户的使用习惯调整该领域下语音空调全双工工作的时长。其中,该领域,可以包括:新闻领域、笑话领域、空调控制领域等。
由此,通过根据使用习惯对不同领域下的工作状态进行调整,可以更加精准和可靠地为用户提供语音控制服务,提升用户体验。
在一个可选实施方式中,还可以包括:对多个语音指令的优先级进行调整的过程,具体可以包括:在确定电器设备在当前领域下的工作模式为全双工工作模式之后,若所述语音数据所包含的控制指令为信息获取指令(如第一信息获取指令、第二信息获取指令等)和控制指令中两个以上指令,则根据使用者的使用习惯确定两个以上指令的优先级,并按确定的优先级执行两个以上指令。
例如:在已经判定为全双工工作模式的领域下,继续分析采集到的用户数据。把用户上下文语音指令的关联性关系分级,根据得到的关联性级别,得出在该领域下语音工作模式的识别退出时机。在全领域下,语音的工作模式都是动态的(如可以动态从控制领域切换到音乐领域等),会根据不同时期采集到的用户数据来进行动态调整,从而使得语音空调更加智能,语音的唤醒和识别更加准确,能够有效分类出不同的领域,通过领域来缩小范围,这样能够减少误识别。
由此,通过对多个语音指令的优先级进行调整,可以按不同使用习惯满足不同用户的使用需求,控制方式更加灵活,也更加人性化。
经大量的试验验证,采用本实施例的技术方案,通过对采集到的语音数据进行识别,根据识别结果确定该语音数据所对应的语音指令是工作于全双工工作模式还是半双工工作模式,可以减少误唤醒和误识别的情况,提高识别率。
根据本发明的实施例,还提供了对应于语音控制方法的一种语音控制装置。参见图4所示本发明的装置的一实施例的结构示意图。该语音控制装置可以应用在具有语音控制功能的电器设备如语音空调、语音电视等上,适用所有语音智能产品,语音工作模式可以在全双工模式和半双工模式之间自动选择切换,能够智能调节语音识别时长,以在特定领域下对语音识别时间进行智能判断和自动调整。其中,电器设备的语音控制装置,可以包括:采集单元102、分析单元104和控制单元106。
在一个可选例子中,采集单元102,可以用于采集语音数据。例如:采集语音空调所在房间内的语音数据。该采集单元102的具体功能及处理参见步骤s110。
可选地,所述语音数据,可以包括:语音指令和/或语音需求。所述采集单元102采集语音数据,可以包括:通过麦克风模块,采集使用者发出的语音指令、和/或使用者说出的语音需求。
例如:可以通过空调麦克风采集用户的使用数据,具体可以是采集用户的说话习惯。如通过麦克风采集用户发出的指令或者用户说出的需求。
由此,通过麦克风采集多种形式的语音数据,可以提升对语音数据采集的全面性,进而可以根据全面采集到的语音数据进行语音控制,不仅保证了对用户需求的满足,还避免了对非用户需求语音的执行而浪费资源并给用户造成困扰。
在一个可选例子中,分析单元104,可以用于对所述语音数据进行分析,得到所述语音数据的上下文关系。该分析单元104的具体功能及处理参见步骤s120。
可选地,所述分析单元104对所述语音数据进行分析,可以包括:
所述控制单元106,具体还可以用于对所述语音数据进行语义分析,以提取所述语音数据所包含的一个以上关键词。该控制单元106的具体功能及处理还参见步骤s210。
所述控制单元106,具体还可以用于根据设定关键词与设定值之间的对应关系,将该对应关系中与每个关键词相同的设定关键词所对应的设定值确定为每个关键词的值。该控制单元106的具体功能及处理还参见步骤s220。
例如:在新闻领域中,语音数据可以是“我想听热门新闻”,提取的关键词可以是“热门新闻”,以进入新闻领域并下发热门新闻链接到空调端。在设定的对应关系中,与“热门新闻”对应的设定值可以是一个数值范围比如3-5,也可以是一个具体的数值比如5。
例如:在笑话领域中,语音数据可以是“我想听笑话”,提取的关键词可以是“笑话”,以进入笑话领域并下发笑话链接到空调端。在设定的对应关系中,与“笑话”对应的设定值可以是一个数值范围比如6-8,也可以是一个具体的数值比如6。
例如:在控制领域中,语音数据可以是“打开上下扫风”,提取的关键词可以是“上下扫风”,以进入控制领域以及下发打开相关上下扫风的协议,通过协议下发到空调并控制空调。在设定的对应关系中,与“上下扫风”对应的设定值可以是一个数值范围比如10-15,也可以是一个具体的数值比如12。
所述控制单元106,具体还可以用于对一个以上关键词的值进行加权求平均值和归一化处理,得到一个以上关键词的平均值,将该平均值作为所述语音数据的上下文关系,即作为所述语音数据所对应的值。该控制单元106的具体功能及处理还参见步骤s230。
例如:用户语音指令的上下文关系,可以包括:提取指令的语义,可以通过自然语言模块处理得到。语音板采集到的用户数据为几个语句,每个语句中有关键词,每个关键词被赋予相应的值如数值。对这几个语句中的几个关键词的值进行加权平均值、归一化等处理,得到平均值,该平均值可以表示这几句话所包含的语音指令的上下文关系。若该平均值达到设定阈值,则表示这几句话所包含的语音指令的上下文关系的关系性强。
由此,通过语义分析来提取关键词,并确定关键词的平均值的方式确定语音数据的上下文关系,使得对某一时段采集的语音数据进行综合处理来准确把握用户需求,有利于提高语音控制的智能化程度。
其中,所述分析单元104对所述语音数据进行分析的执行端,可以包括:语音板或云端。在云端作为对所述语音数据进行分析的执行端的情况下,由电器设备的语音板在本地端将所述语音数据转换为文本信息后,将所述文本信息上传至云端;之后再由语音板接收云端对所述语音数据进行分析后下发的所述语音数据的上下文关系。
例如:在用户使用语音空调的时候,同步采集用户的使用数据,并把采集到的用户的使用数据发送到云端进行分析和处理。如可以通过麦克风采集数据,然后通过语音板中的语音模块生成文本上传到云端,云端分析文本,通过自然语音处理进行分析文本,分析出来的结果进行处理并下发到语音板。
由此,通过多个执行端对语音数据进行分析,可以在网络连接状态和网络断开状态下均实现语音控制,方便用户使用。
在一个可选例子中,控制单元106,可以用于确定所述语音数据的上下文关系是否已达到当前领域下设定阈值。该控制单元106的具体功能及处理参见步骤s130。
其中,所述当前领域,可以包括:信息获取领域(如新闻领域、笑话领域等)、控制领域中的任一领域。
具体地,在所述信息获取领域下,电器设备在本地端通过语音板分析所述语音数据下发的信息获取指令、并调用本地端预先下载并存储的待获取信息,或接收由云端通过分析所述语音数据下发的信息获取指令、以及由云端通过互联网资源收集并下发的待获取信息,并控制电器设备按所述信息获取指令为使用者提供待获取信息。
例如:在所述新闻领域下,电器设备在本地端通过语音板分析所述语音数据下发的第一信息获取指令、并调用本地端预先下载并存储的新闻消息,或接收由云端通过分析所述语音数据下发的第一信息获取指令、以及由云端通过互联网资源收集并下发的新闻消息,并控制电器设备按所述第一信息获取指令为使用者提供新闻消息。
又如:在所述笑话领域下,电器设备在本地端通过语音板分析所述语音数据下发的第二信息获取指令、并调用本地端预先下载并存储的娱乐消息(如笑话消息),或接收由云端通过分析所述语音数据下发的第二信息获取指令、以及由云端通过互联网资源收集并下发的娱乐消息(如笑话消息),并控制电器设备按所述第二信息获取指令为使用者提供娱乐消息(如笑话消息)。
具体地,在所述控制领域下,电器设备在本地端通过语音板分析所述语音数据下发的控制指令,或接收由云端通过分析所述语音数据下发的控制指令,并按所述控制指令控制电器设备为用户提供服务。
例如:语音空调预先设定每个支持领域下的语音的工作模式。语音空调的支持领域,可以包括:按互联网资源类分为新闻领域、笑话领域、空调控制领域。工作模式:就是处在各领域下的运行状态,如全双工工作模式或半双工工作模式。
例如:通过用户的指令在语音板生成文本上传到云端,然后通过自然语音模块进行分析文本语义并判断用户需求,通过分析出的语义切换到不同的领域和需求并下发的空调端。
由此,通过对多个领域进行语音智能控制,可以方便不同控制需求的用户使用,适用范围广,用户体验好。
在一个可选例子中,所述控制单元106,还可以用于若所述语音数据的上下文关系已达到所述设定阈值,则确定电器设备在当前领域下的工作模式为全双工工作模式。该控制单元106的具体功能及处理还参见步骤s140。
在一个可选例子中,所述控制单元106,还可以用于若所述语音数据的上下文关系未达到所述设定阈值,则确定电器设备在当前领域下的工作模式为半双工工作模式。该控制单元106的具体功能及处理还参见步骤s150。
例如:采集语音空调所在环境中的语音数据,对采集到的语音数据进行识别,根据识别结果确定语音空调是工作在全双工工作模式还是半双工工作模式,可以避免误识别,有利于提升语音空调的智能化程度,进而提升用户的使用体验。
例如:在动态地调整语音空调工作在某个领域的全双工和半双工工作模式时,可以采用语音指令的上下文关系,若关系性强(如关系性达到某个阈值),通过设定的阈值动态设置全双工识别和半双工识别。这样,可以智能判断用户的语音指令数据,判断语音指令的上下文关系,若关系性强(如关系性达到某个阈值),则自动划分为全双工识别场景;否则若关系性不强(如关系性未达到某个阈值),则划分为半双工识别场景,从而达到动态调节识别场景工作模式的目的,可以减少误唤醒和误识别的情况发生,提高识别率。
由此,通过一种实现全双工和半双工结合的语音识别方案,能够实现语音空调工作模式的动态自动切换和选择,即动态地调整语音空调工作在某个领域的全双工和半双工工作模式,可以提高全领域下语音空调用户的识别率和提升语音空调的智能化水平。
在一个可选实施方式中,还可以包括:根据使用习惯对不同领域下的工作状态进行调整的过程,具体可以包括:
所述控制单元106,还可以用于在确定电器设备在当前领域下的工作模式为全双工工作模式之后,根据所述语音数据确定使用者的使用习惯。该控制单元106的具体功能及处理还参见步骤s310。
所述控制单元106,还可以用于根据接收由云端通过分析所述语音数据下发的信息获取指令(如第一信息获取指令、第二信息获取指令等)和控制指令中任一指令,并结合所述使用习惯,调整电器设备在当前领域下的工作状态和/或工作时长,以按使用者的使用习惯为使用者提供服务。该控制单元106的具体功能及处理还参见步骤s320。
例如:重新对每个领域工作模式进行调整。具体地,根据用户使用习惯数据,智能判断用户在该领域下的使用习惯。通过采集到的用户语音指令的上下文关系(即用户上下文语音指令的关联性关系),若关系性强(如达到某个阈值)则判断在该领域下该用户的使用习惯是适合于全双工工作模式,否则为半双工工作模式。如根据用户使用习惯数据,智能判断用户在该领域下的使用习惯,可以包括:可以通过用户指令通用自然语音处理进行上下文分析语义,并判断处于哪个领域,并对用户使用习惯进行统计。
例如:每个领域下全双工工作模式的识别时长,可以根据收集到的用户数据进行智能判断,之后再退出对该领域下全双工工作模式的时长识别过程。具体地,若语音空调工作在全双工工作模式下,可以根据实时采集到的用户使用数据,推测出用户的使用习惯、或判断用户的使用习惯,进而根据用户的使用习惯调整该领域下语音空调全双工工作的时长。其中,该领域,可以包括:新闻领域、笑话领域、空调控制领域等。
由此,通过根据使用习惯对不同领域下的工作状态进行调整,可以更加精准和可靠地为用户提供语音控制服务,提升用户体验。
在一个可选实施方式中,还可以包括:对多个语音指令的优先级进行调整的过程,具体可以包括:所述控制单元106,还可以用于在确定电器设备在当前领域下的工作模式为全双工工作模式之后,若所述语音数据所包含的控制指令为信息获取指令(如第一信息获取指令、第二信息获取指令等)和控制指令中两个以上指令,则根据使用者的使用习惯确定两个以上指令的优先级,并按确定的优先级执行两个以上指令。
例如:在已经判定为全双工工作模式的领域下,继续分析采集到的用户数据。把用户上下文语音指令的关联性关系分级,根据得到的关联性级别,得出在该领域下语音工作模式的识别退出时机。在全领域下,语音的工作模式都是动态的(如可以动态从控制领域切换到音乐领域等),会根据不同时期采集到的用户数据来进行动态调整,从而使得语音空调更加智能,语音的唤醒和识别更加准确,能够有效分类出不同的领域,通过领域来缩小范围,这样能够减少误识别。
由此,通过对多个语音指令的优先级进行调整,可以按不同使用习惯满足不同用户的使用需求,控制方式更加灵活,也更加人性化。
由于本实施例的装置所实现的处理及功能基本相应于前述图1至图3所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过对采集到的语音数据进行识别,根据识别结果确定该语音数据所对应的语音指令是工作于全双工工作模式还是半双工工作模式,可以提升识别精度,提升用户体验。
根据本发明的实施例,还提供了对应于语音控制装置的一种电器设备。该电器设备可以包括:以上所述的语音控制装置。
在一些方案中,由于一些语音技术的壁垒导致的语音识别问题尤为严重,也是让用户头疼不已。例如:语音空调会对环境中用户发出的所有语音进行识别并执行,甚至对环境中并非用户发出的声音也进行识别并进行执行,当然,这种执行并不是用户所希望的,这样的话,不仅没有方便用户的使用,反而是给用户造成了干扰。
在一些方案中,采用语音全双工识别工作模式,语音空调支持的领域越多,会导致语音空调只有在接收到用户的数据后才能够答复用户,语音的误识别越严重;采用语音半双工识别工作模式,识别到的语音指令都会下发到语音板上,会导致语音空调只有在接收到用户的数据后才能够答复用户,会使用户出现语音空调不够智能的感觉。
其中,语音全双工识别工作模式,即一个实时的、双向的语音信息的交互方式。语音半双工识别工作模式,即一个实时的、单向的语音信息的交互方式。
在一个可选实施方式中,本发明的方案提出一种实现全双工和半双工结合的语音识别方法和系统,能够实现语音空调工作模式的动态自动切换和选择,即动态地调整语音空调工作在某个领域的全双工和半双工工作模式,可以提高全领域下语音空调用户的识别率和提升语音空调的智能化水平。例如:采集语音空调所在环境中的语音数据,对采集到的语音数据进行识别,根据识别结果确定语音空调是工作在全双工工作模式还是半双工工作模式,可以避免误识别,有利于提升语音空调的智能化程度,进而提升用户的使用体验。
可选地,在动态地调整语音空调工作在某个领域的全双工和半双工工作模式时,可以采用语音指令的上下文关系,若关系性强(如关系性达到某个阈值),通过设定的阈值动态设置全双工识别和半双工识别,全双工模式下通过在线上传语音指令并下发互联网资源。半双工模式下语音指令即使上传到云端但若不能达到设定的阈值也不下发到语音板上,表明语音指令不是用户希望发出的指令、或不是用户发出的,这样解决减少误唤醒和误识别的情况,提高识别率。
具体地,可以智能判断用户的语音指令数据,判断语音指令的上下文关系,若关系性强(如关系性达到某个阈值),则自动划分为全双工识别场景;否则若关系性不强(如关系性未达到某个阈值),则划分为半双工识别场景,从而达到动态调节识别场景工作模式的目的,可以减少误唤醒和误识别的情况发生,提高识别率。
例如:语音板采集到的用户数据为几个语句,每个语句中有关键词,每个关键词被赋予相应的值如数值。对这几个语句中的几个关键词的值进行加权平均值、归一化等处理,得到平均值,该平均值可以表示这几句话所包含的语音指令的上下文关系。若该平均值达到设定阈值,则表示这几句话所包含的语音指令的上下文关系的关系性强。
进一步可选地,每个领域下全双工工作模式的识别时长,可以根据收集到的用户数据进行智能判断,之后再退出对该领域下全双工工作模式的时长识别过程。具体地,若语音空调工作在全双工工作模式下,可以根据实时采集到的用户使用数据,推测出用户的使用习惯、或判断用户的使用习惯,进而根据用户的使用习惯调整该领域下语音空调全双工工作的时长。其中,该领域,可以包括:新闻领域、笑话领域、空调控制领域等。
下面可以参见图5所示的例子,对本发明的方案的具体实现过程进行示例性说明。
图5为语音空调实现全双工和半双工结合的语音识别的流程示意图。如图5所示,语音空调实现全双工和半双工结合的语音识别的过程,可以包括:
步骤1、语音空调预先设定每个支持领域下的语音的工作模式。
其中,语音空调的支持领域,可以包括:按互联网资源类分为新闻领域、笑话领域、空调控制领域。工作模式:就是处在各领域下的运行状态,如全双工工作模式或半双工工作模式。
步骤2、在用户使用语音空调的时候,同步采集用户的使用数据,并把采集到的用户的使用数据发送到云端进行分析和处理。
可选地,可以通过空调麦克风采集用户的使用数据,具体可以是采集用户的说话习惯。如通过麦克风采集用户发出的指令或者用户说出的需求。
例如:采集说话习惯,可以包括:通过麦克风记录用户说的某些话的频率并储存在云端,通过用户的使用数据并保存用户的习惯;当麦克风再次采集到该用户唤醒词就可以判断出用户的需求,通过用户的需求可以对空调或者获取相应云端资源。
可选地,可以通过麦克风采集数据,然后通过语音板中的语音模块生成文本上传到云端,云端分析文本,通过自然语音处理进行分析文本,分析出来的结果进行处理并下发到语音板。
步骤3、重新对每个领域工作模式进行调整。具体地,根据用户使用习惯数据,智能判断用户在该领域下的使用习惯。通过采集到的用户语音指令的上下文关系(即用户上下文语音指令的关联性关系),若关系性强(如达到某个阈值)则判断在该领域下该用户的使用习惯是适合于全双工工作模式,否则为半双工工作模式。
例如:确定工作模式之后的调整,可以包括:通过用户用词习惯,并提取用户的语义来判断空调处于什么领域,比如控制领域就开启空调相应功能或者音乐领域就播放相应的歌曲。
可选地,根据用户使用习惯数据,智能判断用户在该领域下的使用习惯,可以包括:可以通过用户指令通用自然语音处理进行上下文分析语义,并判断处于哪个领域,并对用户使用习惯进行统计。
可选地,用户语音指令的上下文关系,可以包括:提取指令的语义,可以通过自然语言模块处理得到。
步骤4、在已经判定为全双工工作模式的领域下,继续分析采集到的用户数据。把用户上下文语音指令的关联性关系分级,根据得到的关联性级别,得出在该领域下语音工作模式的识别退出时机。
步骤5、在全领域下,语音的工作模式都是动态的(如可以动态从控制领域切换到音乐领域等),会根据不同时期采集到的用户数据来进行动态调整,从而使得语音空调更加智能,语音的唤醒和识别更加准确,能够有效分类出不同的领域,通过领域来缩小范围,这样能够减少误识别。
例如:通过用户的指令在语音板生成文本上传到云端,然后通过自然语音模块进行分析文本语义并判断用户需求,通过分析出的语义切换到不同的领域和需求并下发的空调端。
其中,本发明的方案,适用所有语音智能产品,语音工作模式可以在全双工模式和半双工模式之间自动选择切换,能够智能调节语音识别时长,以在特定领域下对语音识别时间进行智能判断和自动调整。
由于本实施例的电器设备所实现的处理及功能基本相应于前述图4所示的装置的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过对采集到的语音数据进行识别,根据识别结果确定该语音数据所对应的语音指令是工作于全双工工作模式还是半双工工作模式,可以避免误识别,提升语音数据的识别精准性和可靠性。
根据本发明的实施例,还提供了对应于语音控制方法的一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行以上所述的语音控制方法。
由于本实施例的存储介质所实现的处理及功能基本相应于前述图1至图3所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过对采集到的语音数据进行识别,根据识别结果确定该语音数据所对应的语音指令是工作于全双工工作模式还是半双工工作模式,可以提升语音空调的智能化程度,进而提升用户的使用体验。
根据本发明的实施例,还提供了对应于语音控制方法的一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行以上所述的语音控制方法。
由于本实施例的处理器所实现的处理及功能基本相应于前述图1至图3所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
经大量的试验验证,采用本发明的技术方案,通过对采集到的语音数据进行识别,根据识别结果确定该语音数据所对应的语音指令是工作于全双工工作模式还是半双工工作模式,能够智能调节语音识别时长,以在特定领域下对语音识别时间进行智能判断和自动调整。
综上,本领域技术人员容易理解的是,在不冲突的前提下,上述各有利方式可以自由地组合、叠加。
以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除