语音交互方法、服务器和计算机可读存储介质与流程
本申请涉及语音识别技术领域,特别涉及一种车辆的语音交互方法、服务器和计算机可读存储介质。
背景技术:
随着人工智能技术的发展,语音智能平台或者说语音助手因为能够在一定条件下识别用户的语音输入并生成相应的操作指令,为用户操作车辆设备,例如车辆的中控显示屏,提供了极大的便利,而被广泛应用。然而,相关技术中,语音助手无法对用户的对话状态进行追踪进而无法与用户进行连续对话,智能性较差。
技术实现要素:
有鉴于此,本申请的实施例提供了一种车辆的语音交互方法、服务器和计算机可读存储介质。
本申请提供了一种车辆的语音交互方法,包括:
对接收的当前轮次语音信息进行场景任务校验;
根据所述场景任务校验的结果对在先轮次语音信息对应的场景任务数据进行更新;
根据更新后的场景任务数据确定对应当前轮次语音信息的对话动作以与用户进行交互。
在某些实施方式中,所述对接收的当前轮次语音信息进行场景任务校验包括:
利用预设定的场景页面操作的范式对所述当前轮次语音信息命中的场景页面任务进行校验。
在某些实施方式中,所述场景任务数据包括场景数据树,根据所述场景任务校验的结果对在先轮次语音信息对应的场景任务数据进行更新包括:
根据所述当前轮次语音信息和所述在先轮次语音信息共同对应的车辆图形用户界面信息生成场景数据树;
根据所述场景任务校验的结果确认所述场景数据树中命中的节点。
在某些实施方式中,所述根据更新后的场景任务数据确定对应当前轮次语音信息的对话动作以与用户进行交互包括:
根据所述场景数据树中命中的节点确定所述场景数据树的根节点数目以确定可执行任务数量;
根据所述可执行任务数量确定对应当前轮次语音信息的对话动作。
在某些实施方式中,所述根据所述可执行任务数量确定对应当前轮次语音信息的对话动作包括:
若所述可执行任务数量为1,生成执行所述可执行任务的对话动作。
在某些实施方式中,所述根据所述可执行任务数量确定对应当前轮次语音信息的对话动作包括:
若所述可执行任务数量不为1,生成引导或澄清所述可执行任务的对话动作。
在某些实施方式中,所述交互方法还包括:
判断所述当前轮次语音信息的轮次数;
若所述轮次数未达到轮次数阈值,将对所述根据更新后的场景任务数据进行存储。
在某些实施方式中,所述对接收的当前轮次语音信息进行场景任务校验前还包括:
加载在先轮次语音信息对应的场景任务数据。
本申请提供了一种服务器,所述服务器包括:
校验模块,用于对接收的当前轮次语音信息进行场景任务校验;
更新模块,用于根据所述场景任务校验的结果对在先轮次语音信息对应的场景任务数据进行更新;
确定模块,根据更新后的场景任务数据确定对应当前轮次语音信息的对话动作以与用户进行交互。
本申请提供了一种包含计算机可执行指令的非易失性计算机可读存储介质,当所述计算机可执行指令被一个或多个处理器执行时,使得所述处理器执行所述的车辆的语音交互方法。
本申请实施方式的车辆的语音交互方法、服务器和计算机可读存储介质中,在用户与车辆进行语音交互过程中,通过对当前轮次语音进行校验,从而结合用户语音对当前图形用户界面进行对话状态追踪,使多轮交互过程中的对话更连贯,根据图形用户界面中场景任务数据的变化引导用户准确完整地表达操作意图,语音交互的智能性和用户体验更佳。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请某些实施方式的语音交互方法的流程示意图。
图2是本申请某些实施方式的服务器的模块示意图。
图3是本申请某些实施方式的语音交互方法的流程示意图。
图4是本申请某些实施方式的语音交互方法的流程示意图。
图5是本申请某些实施方式的场景数据树的示意图。
图6是本申请某些实施方式的语音交互方法的流程示意图。
图7是本申请某些实施方式的语音交互方法的流程示意图。
图8是本申请某些实施方式的语音交互方法的场景示意图。
图9是本申请某些实施方式的语音交互方法的流程示意图。
图10是本申请某些实施方式的语音交互方法的场景示意图。
图11是本申请某些实施方式的语音交互方法的场景示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
请参阅图1,本申请提供了一种车辆的语音交互方法。包括:
s10:对接收的当前轮次语音信息进行场景任务校验;
s20:根据场景任务校验的结果对在先轮次语音信息对应的场景任务数据进行更新;
s30:根据更新后的场景任务数据确定对应当前轮次语音信息的对话动作以与用户进行交互。
本申请实施方式提供了一种服务器。服务器包括通信元件和处理器。通信元件用于接收车辆上传的当前轮次的语音信息。处理器用于根据场景任务校验的结果对在先轮次语音信息对应的场景任务数据进行更新,以及用于根据更新后的场景任务数据确定对应当前轮次语音信息的对话动作以与用户进行交互。
请参阅图2,本申请实施方式还提供了一种服务器100,本申请实施方式的语音交互方法可以由本申请实施方式的服务器100实现。
具体地,服务器100包括校验模块102、更新模块104和确定模块106。s10可以由校验模块102实现,s20可以由场更新模块104实现,s30可以由确定模块106实现。或者说,校验模块102用于对接收的当前轮次语音信息进行场景任务校验。更新模块104用于根据场景任务校验的结果对在先轮次语音信息对应的场景任务数据进行更新。确定模块106用于根据更新后的场景任务数据确定对应当前轮次语音信息的对话动作以与用户进行交互。
本申请实施方式的车辆的语音交互方法和服务器100中,在用户与车辆进行语音交互过程中,根据场景任务校验的结果对在先轮次语音信息对应的场景任务数据进行更新,以及用于根据更新后的场景任务数据确定对应当前轮次语音信息的对话动作以与用户进行交互。
具体地,车辆包括显示区域、电声元件、通信元件和处理器等。车辆的显示区域可以包括仪表屏、车载显示区域屏幕以及车辆挡风玻璃上可以实现的抬头显示等。车辆上运行的车载系统使用图形用户界面(graphicaluserinterface,gui)为用户呈现展示的内容。显示区域包括诸多ui元素,不同的显示区域可以展示相同或不同的ui元素。其中,ui元素可以包括卡片对象、应用程序图标或界面、文件夹图标、多媒体文件图标以及用于进行交互可操作的控件等。
车辆的智能显示区域可以为用户提供控制车辆以及与车辆进行交互的便捷入口,在车载操作系统中添加语音助手,能够在一定条件下通过识别语音便捷地生成相应的控制指令,进一步地为用户与车辆的交互提供便利。然而,语音助手能够进行的语音交互有限,通常只能与预设定的操作目标进行交互,而对于非预定的操作目标无法理解用户的真实目的,用户仅能通过在图形用户界面中对操作目标进行输入,与操作目标进行交互,而无法通过语音实现交互。并且语音交互功能较为初级,无法实现与用户进行连续的对话,往往在一轮对话后就结束交互过程,无论是否真正理解用户的真实意图。或者说,前后进行的多轮对话之间没有关联,相互独立。
在本实施方式中,用户唤醒语音助手后,进行语音信息输入,在获取语音信息的同时,同时获取车辆系统当前正在运行的车载系统或应用程序的图形用户界面信息。图形用户界面信息包括当前图形用户界面中元素的布局信息,例如当前图形用户界面中包含的控件、每个控件的类型、位置,不同控件之间的关联关系等。
进一步地,车辆将本地采集的语音输入信息和图形用户界面信息发送至云端的服务器,服务器根据图形用户界面信息可以获知与用户进行交互的图形用户界面以及界面中的相关内容,从而利用图形用户界面信息作为辅助信息,在语义理解时对语音输入信息进行解析,生成相应的场景任务,并回传给本地的车辆,进而车辆根据操作指令执行对应的操作。
可以理解地,图形用户界面信息可以让服务器在进行语义理解时,如同用户所见,更加明确车辆当前图形用户界面中所包含的内容。在语音交互时,如同用户与图形用户界面进行交互,在图形用户界面中能够实施的交互都可以在进行语义理解时明确目标对象,从而实现用户原本与图形用户界面的交互以语音方式进行。
服务器对接收到的当前轮次语音信息结合图形用户界面进行语义理解后,对语义理解命中的场景页面的操作进行场景任务校验从而确定语义理解所命中的控件是否可执行、引导或澄清。
若在当前轮次前存在历史对话,则加载历史对话信息,或者说在先轮次对应的场景任务数据,根据场景任务校验的结果场景任务数据进行更新,从而根据更新后的场景任务数据确定对应当前轮次的语音信息的对话动作。
对话动作。也即是,对话当前的场景任务状态所触发的动作,包含执行、引导、澄清、确认、取消、结束等。例如,如果对话动作是执行则将下发执行命令。如果对话动作是引导、澄清或确认,则生成并播放引导、澄清、确认的话术语音。
在实际操作中,服务器中具有一任务追踪器,历史场景任务数据储存在任务追踪器中。当语音信息的语义明确时,那么经场景语义理解后其所能命中的控件及操作可能是唯一的,那么则可以生成的对话动作是对命中的控件进行执行操作,执行操作包括命中的控件、控件操作及操作值等内容。
而如果语音信息的语义不够明确,或者说,经过场景语义理解,例如同时命中多个控件,或者仅命中动作而无控件,那么,则无法生成确定的对话动作,就需要生成相应的引导或澄清话术,通过电声元件进行播放,与用户形成对话,也即是,对话动作是引导、澄清或确认,则生成并播放引导、澄清、确认的话术语音的反馈信息。
在一个示例中,当前图形用户界面为车窗调节界面,用户通过语音与车辆进行交互,希望控制左侧前门的车窗打开,发出语音请求“打开左前门车窗20%”,经过场景语义理解,并经过校验后点击操作的可执行条件为控件和操作,且确认命中了唯一控件,即左侧前门车窗的按钮,则可生成左前车窗打开20%的执行指令下发车辆,同时可生成如“好的,正在为您打开左前车窗”等相类似的表示确认的反馈信息一并下发车辆,由车辆执行。
若用户发出“打开车窗”,根据场景语义理解,命中的图形界面中的控件可能包括左前门车窗按钮、左后门车窗按钮、右前门车窗按钮、右后门车窗按钮、天窗按钮等多个控件。在这种情况下,由于控件不唯一,无法直接生成执行任务,此时,可生成“请问要打开哪一个车窗”等相类似的用于引导用户表达明确语义的反馈信息由车辆进行播报,用户可根据反馈信息进行后续的语音信息输入,直至达到对话轮次的上限,或服务器明确语义。
请参阅图3,在某些实施方式中,s10包括:
s11:利用预设定的场景页面操作的范式对当前轮次语音信息命中的场景页面任务进行校验。
在某些实施方式中,s11可以由校验模块102实现,或者说,校验模块102用于利用预设定的场景页面操作的范式对当前轮次语音信息命中的场景页面任务进行校验。
在某些实施方式中,处理器用于利用预设定的场景页面操作的范式对当前轮次语音信息命中的场景页面任务进行校验。
具体地,对场景语义理解结果所命中的场景页面操作进行范式校验,可判断该命中的控件是否满足执行条件。例如场景语义理解结果命中了按钮,以及其的点击操作,点击操作的执行条件为控件和操作,按钮满足检验条件,可执行。在处理过程中,依次对语义理解结果输出的控件的返回结果进行校验,从而得出控件是否可执行、是否可引导或澄清。根据可执行校验的结果更新对场景任务数据进行更新,以用于为确认对话动作提供依据。例如,经场景任务校验后确认有两个可执行的控件,那么对话动作就可能更新为澄清或引导。而如果场景任务校验后确认有一个可执行的控件,那么对话动作就可能更新为执行。
图形用户界面中控件的场景任务校验,将控件的操作与执行或引导澄清条件建立关联。如此,可以对根据场景语义理解中命中的控件的操作类型与相关条件进行检验,从而判断是否可以执行、引导或澄清。
例如,对于点击、选中、打开和关闭等操作,对应的可执行条件为控件和操作。滑动操作对应的执行条件为控件、操作和滑动值。单选和多选操作对应的执行条件为控件、操作和选择序号。输入文本操作对应的执行条件为控件、操作和文本。方位滑动操作对应的执行条件为控件、操作、方向和移动位置。
在一个示例中,用户发出“打开车窗”语音信息。经场景语义理解后,命中五个按钮:“打开左前门车窗”、“打开左后门车窗”、“打开右前门车窗”、“打开右后门车窗”、“打开天窗”以及其的点击操作。
经过校验后,由上述可知,点击操作的执行条件为控件和操作,也即是说该场景任务中所包含的五个按钮均满足,均为可执行任务。进一步地,结合在先轮次的场景任务数据,例如上下文信息等,可确定对话动作。
请参阅图4,在某些实施方式中,场景任务数据包括场景数据树。s20包括:
s21:根据当前轮次语音信息和在先轮次语音信息共同对应的车辆图形用户界面的控件属性信息生成场景数据树;
s22:根据场景任务校验的结果确认场景数据树中命中的节点。
在某些实施方式中,s21和s22可以由更新模块104实现。或者说,更新模块104用于根据当前轮次语音信息和在先轮次语音信息共同对应的车辆图形用户界面的控件属性信息生成场景数据树,以及用于根据场景任务校验的结果确认场景数据树中命中的节点。
在某些实施方式中,处理器用于根据当前轮次语音信息和在先轮次语音信息共同对应的车辆图形用户界面的控件属性信息生成场景数据树,以及用于根据场景任务校验的结果确认场景数据树中命中的节点。
请参阅图5,具体地,图形用户界面信息,以图形用户界面中的控件为单位,信息包括控件的控件标识、控件类型、文本描述、控制支持的操作方式、操作参数、多个控件在界面中的位置、布局关系等相关属性。
其中,控件标识可用于标识当前图形用户界面中的每个元素,每个元素具有唯一的标识。元素也即是当前图形用户界面中呈现的内容,以信息点卡片界面为例,其中的元素包括信息点名称、地址、收藏、搜周边、导航路线等。
文本描述,也即是对该元素在图形用户界面中的表达方式,例如,对于收藏控件,其文本描述为“收藏”。
控件类型也即是该元素在图形用户界面中的元素呈现类型,例如按钮、滑块、状态按钮、文本输入框、复选框、单选按钮、群组按钮、开关按钮、视图、组、对话框等。
控件支持的操作方式,即对应类型的控件可以进行的操作,例如按钮可支持的操作包括点击及选中,滑块可支持的操作包括滑动及选中,状态按钮可支持的操作包括点击、滑动、选中、单选及多选,文本输入框可支持的操作包括点击、选中及输入文本复选框可支持的操作包括点击、多选及选中,单选按钮可支持的操作包括点击、单选及选中,群组按钮可支持的操作包括点击、方位滑动和选中,开关按钮可支持的操作包括点击、打开、关闭和选中,视图可支持的操作包括点击、方位滑动、单选和选中、组可支持的操作包括点击和选中、对话框的操作包括点击和方位滑动。
操作参数对应操作方式的程度,例如,点击对应的操作参数为短按、长按,方位滑动对应的操作参数为大中小等。
进一步地,用户图形界面中可能包含同时运行的一个或多个应用程序,因此可能存在多个组织架构的控件。这些控件可以类树形图的形式构建起来,也即是场景数据树,树形结构中的每一个节点代表一个控件,节点属性包括控件标识、控件类型、控件标签等。如此,通过该场景数据树就可表征当前图形界面中的控件布局信息。
根据当前轮次语音信息和在先轮次语音信息共同对应的车辆图形用户界面信息生成场景数据树,将时间信息(当前轮次、在先轮次的语音信息)和空间信息(场景数据),在数据层面进行融合。
例如,在首轮对话中,用户发出“打开车窗”,根据当前车窗控制页面构建该场景页面对应的场景数据树,根据语义理解以及场景任务校验,可执行任务数量为5,则将这5个可执行任务分别对应的控件到根节点的树状结构保留,而将其他节点屏蔽,完成场景数据树的更新。更新后的场景数据存入任务追踪器中,以供在次轮对话中继承。
在次轮对话中,继承上一轮次的场景数据树,然后根据次轮对话语音信息的语义理解和场景任务校验结果,在该数据树的技术上进一步进行状态更新。也即是,对于每一轮次的场景数据树的更新,都是根据当前轮次语音信息的语义理解和校验结果基于在先轮次语音信息筛选后保留的场景数据树上得到。
请参阅图6,在某些实施方式中,s30包括:
s31:根据场景数据树中命中的节点确定场景数据树的根节点数目以确定可执行任务数量;
s32:根据可执行任务数量确定对应当前轮次语音信息的对话动作。
在某些实施方式中,s31和s32可以由确定模块106实现。或者说,确定模块106用于根据场景数据树中命中的节点确定场景数据树的根节点数目以确定可执行任务数量,以及用于根据可执行任务数量确定对应当前轮次语音信息的对话动作。
在某些实施方式中,处理器用于根据场景数据树中命中的节点确定场景数据树的根节点数目以确定可执行任务数量,以及用于根据可执行任务数量确定对应当前轮次语音信息的对话动作。
可以理解地,在根据场景数据中命中的节点确定可执行任务后,需要进一步确定可执行任务是否可以直接执行。也即是当前轮次语音信息的对话动作。本实施方式中,通过场景数据树的根节点数目确定可执行任务数量,进而根据可执行任务数量确定对应当前轮次语音信息的对话动作。
场景数据树用于表征当前图形用户界面的组织架构,根节点为当前图形用户界面的视图,根节点的可执行任务数量代表当前图形界面中全部可执行任务数量。在执行过程中,进行场景任务校验命中的可知执行任务对应的节点处,对其可执行任务数量进行计数,进而对场景数据树由下至上,累加各个节点的可执行任务数量,直至根节点处,也即是说,当前节点的可执行任务数量为其子节点的可执行任务数量之和。
例如,在交互过程中,用户发出“打开车窗”语音信息,经场景任务校验后命中了“打开左前门车窗”、“打开左后门车窗”、“打开右前门车窗”、“打开右后门车窗”、“打开天窗”等五个可执行任务。
场景数据树进行状态更新,其中,包括5个可执行的控件,可执行任务数量为5。
进一步地,交互过程中的对话状态或者说可执行任务的任务参数也同时被记录,对话状态记录包括交互过程的初始参数、交互过程中的参数等内容。初始参数包括初始设定的语音交互的总计轮次,可以理解地,设定总计轮次可以有效防止因为始终无法获取到准确语义而导致语音交互进入死循环的情况。交互过程中的参数可包括当前对话的轮次,可执行任务数量等。
例如,设定语音交互的总轮次为3轮,也即是,若当前为第三轮对话,且仍然无法生成执行命令的第一对话信息,则结束与用户的语音交互,而若当前为首轮或第二轮对话,若无法生成执行命令,则可根据语义理解进行引导或澄清。
请参阅图7,在某些实施方式中,s32包括:
s321:若可执行任务数量为1,生成执行可执行任务的对话动作。
在某些实施方式中,s321可以由确定模块106实现。或者说,确定模块106用于在可执行任务数量为1的情况下,生成执行可执行任务的对话动作。
在某些实施方式中,处理器用于在可执行任务数量为1的情况下,生成执行可执行任务的对话动作。
请参阅图8,具体地,当根节点可执行任务数量为1时,则说明当前轮次的语音信息在语义理解和场景任务校验后命中的可执行任务唯一确定,在这种情况下可生成执行的对话动作,具体而言,可下发针对该控件的执行指令,包括控件标识、该控件的操作方式及操作参数。同时由文本生成模块根据执行指令生成与对话动作对应的反馈信息。
例如,用户通过语音与车辆进行交互,发出“打开左前门车窗20%”,根据语音理语义理解,命中的场景任务包括一个按钮,以及其的点击操作。经场景任务校验后,点击操作的可执行条件为控件和操作,该按钮满足可执行的条件。经统计,在场景数据树中的根节点可执行任务数量为1,该可执行任务可直接执行,确定对话动作为执行。生成左前车窗打开20%的执行指令下发车辆,同时可生成如“好的,正在为您打开左前门车窗”、“已将左前门车窗打开至20%”等相类似的表示确认的反馈信息一并下发车辆,由车辆播报。
请参阅图9,在某些实施方式中,s32还包括:
s322:若所述可执行任务数量不为1,生成引导或澄清所述可执行任务的对话动作。
在某些实施方式中,s322可以由确定模块106实现。或者说,确定模块106用于在可执行任务数量不为1的情况下,生成引导或澄清所述可执行任务的对话动作。
在某些实施方式中,处理器用于在可执行任务数量不为1的情况下,生成引导或澄清所述可执行任务的对话动作。
请参阅图10,具体地,当根节点可执行任务数量不为1时,则说明语义理解命中了多个场景任务,经场景任务校验后该多个场景任务均为可执行任务,因此不确定究竟执行其中的哪一个。在这种情况下可执行任务不能立即执行,需要进行引导或澄清。
其中,引导是指以示范性的对话信息对用户形成教导,引导用户以对话信息的样式进行语音交互,从而可以进行语义更加明确的语音信息输入。例如,“请问您是要打开左前门车窗吗”,“请以打开左前门车窗的表述对我重新下达指令”等内容的反馈信息。
澄清是指以询问的方式使得用户在后续对话中能够对首轮对话中不清楚的信息进行解释澄清,从而可以明确用户的语义。例如“请问您要打开哪个车窗”,“请问您打开多大高度”等内容的第一对话信息。
例如,用户通过语音与车辆进行交互,发出“打开车窗”,根据语义理解命中场景任务包括五个按钮,“打开左前门车窗”、“打开左后门车窗”、“打开右前门车窗”、“打开右后门车窗”、“打开天窗”以及其的点击操作。经场景任务校验后,点击操作的可执行条件为控件和操作,五个按钮满足均可执行的条件。经统计,在数据树中的根节点可执行任务数量为5,不可直接执行,确定对话动作是澄清或引导。生成用于引导或澄清的反馈信息下发车辆,由车辆播报。
在这种情况下,生成引导或澄清的对话动作,根据任务参数决定。例如当前为首轮对话,由于轮次较少,未达到3轮的上限,可确定对话动作为澄清。又如,当前为第2轮对话,根据该轮次的语音信息,仍然无法唯一确定可执行任务,那么就需要引导用户在第三轮对话中准确表达,否则可能会导致在第三轮对话后交互结束,此时,可确定对话动作为引导。
在某些实施方式中,交互方法还包括:
判断当前轮次语音信息的轮次数;
若轮次数未达到轮次数阈值,将对根据更新后的场景任务数据进行存储。
在某些实施方式中,上述步骤可以由服务器100实现,也即是说,服务器100用于判断所述当前轮次语音信息的轮次数,以及用于在轮次数未达到轮次数阈值的情况下,将对根据更新后的场景任务数据进行存储。
在某些实施方式中,处理器用于判断当前轮次语音信息的轮次数,以及用于在轮次数未达到轮次数阈值的情况下,将对根据更新后的场景任务数据进行存储。
具体地,在交互过程中,由于在先轮次语音信息内容的不足、冗余或用户对历史对话的反悔,需要引导、澄清、确认等多轮交互。因此,在多轮任务中,用户关注的信息范围会逐渐由整个图形用户界面缩减至交互上文中提及的相关控件,也即是图形用户界面的一部分。因此,可将部分图形用户界面中的部分屏蔽,作为当前轮次的轮次语音信息的场景信息输入进行场景语义理解。也即是说,加载在先轮次的场景数据树,然后以此为基础,根据本轮语义理解命中的控件,在校验后更新场景数据树。
交互过程中,可利用任务追踪器实现对话上下文的存入、读取。若任务未结束且不可执行,只保存当前的场景状态树上的相关节点。如:若可执行数大于1,则保存所有可执行数大于0的节点。只保留相关控件到根节点,下一轮场景匹配理解模块可以降低匹配的阈值,从而实现更自然的对话。
若当前对话为首轮对话,则根据场景数据构建场景数据树,然后根据语义理解命中以及场景任务校验的情况,更新场景数据树,保留多个相关可执行控件到根节点,并存入任务追踪器中。
当前轮次为中间轮次,将每轮次更新后的场景数据树进行存储,并在下一轮次中进行加载,限定进行语义理解的场景范围。
在某些实施方式中,交互方法在s10前还包括:
加载在先轮次语音信息对应的场景任务数据。
在某些实施方式中,上述步骤可以由服务器100实现,也即是说,服务器100用于加载在先轮次语音信息对应的场景任务数据。
在某些实施方式中,处理器用于加载在先轮次语音信息对应的场景任务数据。
请参阅图11,具体地,后续对话过程首先加载任务追踪器中的在先轮次的场景任务数据树,根据当前轮次的语义理解和校验结果更新场景数据树,可以理解,在在先轮次的场景数据树,经过命中匹配等操作后限定的图形用户界面区域的信息量少,语义理解会降低匹配的阈值,从而实现多轮对话精度的提升。
例如,在首轮对话中,用户发出“打开车窗”,根据语义解析和场景任务校验,可执行任务数量为5,则将这5个可执行任务分别对应的控件到根节点的树状结构保留,而将其他节点屏蔽,完成场景数据树的更新。同时下发“请问要打开哪个车窗”的反馈信息对话信息。
在次轮对话时,用户根据第一对话信息,发出“打开左前门车窗”的语音信息,从任务追踪器将首轮对话的场景数据数作为输入,在此基础上进行语义理解确定场景任务包括一个按钮“左前门车窗”以及其的点击操作,经场景任务校验,该按钮满足可执行的条件,在首轮场景数据树的基础上进行更新,场景数据树的根节点可执行任务数量为由5变为1,可以直接执行,生成执行的对话动作,同时可下发表示确认的反馈信息,如“已为您打开左前门车窗”。
本申请实施方式还提供了一种计算机可读存储介质。一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当计算机可执行指令被一个或多个处理器执行时,使得处理器执行上述任一实施方式的车辆的语音交互方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,程序可存储于一非易失性计算机可读存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)等。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除