HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

一种人机交互方法、装置及智能交互终端与流程

2021-01-28 14:01:39|301|起点商标网
一种人机交互方法、装置及智能交互终端与流程

本发明涉及智能语音技术领域,更具体的说,是涉及一种人机交互方法、装置及智能交互终端。



背景技术:

目前,随着人工智能技术的发展,智能语音机器人已经被广泛应用在各行各业,智能语音机器人能够基于语音识别、意图识别以及语音合成等技术,实现人机交互。

但目前人机交互过程中,智能语音机器人能够识别并采用的语言模式比较单一,在用户与智能语音机器人之间的语言模式不同的情况下,容易造成用户与智能语音机器人之间的交流障碍,影响人机交互的效果,并且增加了用户与智能语音机器人之间的交互次数,进而增加了智能语音机器人侧处理器的负担。



技术实现要素:

有鉴于此,本发明提供了一种人机交互方法、装置及智能交互终端,以避免用户与智能语音机器人之间出现交流障碍,提高人机交互的效果,减少用户与智能语音机器人之间的交互次数,减轻智能语音机器人侧处理器的负担。

一种人机交互方法,所述方法包括:

响应于语音交互触发指令,获取用户的语言类型标识信息;

确定与所述语言类型标识信息对应的语言类型,作为目标语言类型;

从预先训练的语言交互模型中,选择出与所述目标语言类型对应的语言交互模型,作为目标语言交互模型;

基于所述目标语言交互模型所具有的目标语言交互模式,识别用户发出的语音信息,以及向用户发出符合目标语言类型的语音信息。

优选的,在基于所述目标语言交互模型所具有的目标语言交互模式,无法识别出用户发出的语音信息的情况下,所述方法还包括:

对用户发出的语音信息进行分析,确定用户发出的语音信息对应的语言类型,作为更新后的目标语言类型;

从预先训练的语言交互模型中,选择出与所述更新后的目标语言类型对应的语言交互模型,作为更新后的目标语言交互模型;

基于所述更新后的目标语言交互模型所具有的更新后的目标语言交互模式,重新识别用户发出的语音信息,以及向用户发出符合更新后的目标语言类型的语音信息。

优选的,所述语言交互模型的训练过程包括:

获取不同语言类型的训练语料以及不同语言类型的训练语料各自对应的参考输出语音信息;

将所述不同语言类型的训练语料输入到模型中进行训练,得到不同语言类型的训练语料各自对应的预测语音信息;

利用所述不同语言类型的训练语料各自对应的参考输出语音信息,以及不同语言类型的训练语料各自对应的预测语音信息,得到语言交互模型的损失函数;

利用所述语言交互模型的损失函数对所述语言交互模型的模型参数进行调整;

返回执行所述将所述不同语言类型的训练语料输入到模型中进行训练,得到不同语言类型的训练语料各自对应的预测语音信息的步骤继续训练,直至得到语言交互模型的损失函数呈现收敛状况时的语言交互模型的模型参数作为语言交互模型参数,并停止训练。

优选的,在确定的用户的目标语言类型为多个的情况下,所述方法还包括:

向用户提示目标语言类型选择指示信息;

依据用户对目标语言类型的选择指令,从多个目标语言类型中确定最终语言类型。

优选的,所述从预先训练的语言交互模型中,选择出与所述目标语言类型对应的语言交互模型,作为目标语言交互模型包括:

从预先训练的语言交互模型中,选择出与所述最终语言类型对应的语言交互模型,作为目标语言交互模型。

优选的,所述方法还包括:

接收用户的语言类型输入信息;

依据所述语言类型输入信息,确定所述用户的目标语言类型。

优选的,所述响应于语音交互触发指令,获取用户的语言类型标识信息包括:

响应于用户触发的语音交互触发指令,或,响应于服务器触发的语音交互触发指令,获取用户的语言类型标识信息。

优选的,所述语言类型标识信息至少包括:

用户常驻地信息、用户户籍所在地信息、用户号码归属地、用户网络账号归属地、用户业务办理地所在信息、用户历史交互语言以及用户身份标识信息中的至少一种。

一种人机交互装置,所述装置包括:

标识信息获取单元,用于响应于语音交互触发指令,获取用户的语言类型标识信息;

目标语言类型确定单元,用于确定与所述语言类型标识信息对应的语言类型,作为目标语言类型;

目标语言交互模型确定单元,用于从预先训练的语言交互模型中,选择出与所述目标语言类型对应的语言交互模型,作为目标语言交互模型;

交互单元,用于基于所述目标语言交互模型所具有的目标语言交互模式,识别用户发出的语音信息,以及向用户发出符合目标语言类型的语音信息。

一种智能交互终端,包括:存储器和处理器;

所述存储器用于存储计算机程序;

所述处理器用于执行所述存储器中存储的计算机程序;

所述计算机程序用于执行如上所述的人机交互方法。

经由上述的技术方案可知,与现有技术相比,本发明提供了一种人机交互方法、装置及智能交互终端,通过响应于语音交互触发指令,获取用户的语言类型标识信息;确定与所述语言类型标识信息对应的语言类型,作为目标语言类型;从预先训练的语言交互模型中,选择出与所述目标语言类型对应的语言交互模型,作为目标语言交互模型;基于所述目标语言交互模型所具有的目标语言交互模式,识别用户发出的语音信息,以及向用户发出符合目标语言类型的语音信息。通过基于用户的语言类型标识信息识别出用户的目标语言类型,并基于与目标语言类型对应的目标语言交互模型与用户进行语音交互,使得智能语音机器人使用用户能够识别的语言类型与用户进行交互,避免用户与智能语音机器人之间出现交流障碍,提高人机交互的效果,减少了用户与智能语音机器人之间的交互次数,减轻智能语音机器人侧处理器的负担。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的人机交互方法的流程图;

图2为本发明实施例提供的另一种人机交互方法的流程图;

图3为本发明实施例提供的另一种人机交互方法的流程图;

图4为本发明实施例提供的人机交互装置的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

目前,随着人工智能技术的发展,智能语音机器人已经被广泛应用在各行各业,智能语音机器人是一种基于语音识别、意图识别、语音合成技术的智能语音系统,实现机器模拟真人与用户进行语音对话,实现与用户的语音交流。

在目前人机交互过程中,智能语音机器人能够识别并采用的语言模式比较单一,比如大多数智能语音机器人只能采用普通话与用户进行交流,在用户与智能语音机器人之间的语言模式不同的情况下,容易造成用户与智能语音机器人之间的交流障碍,比如,在用户采用地方方言语言模式,而智能语音机器人采用普通话语言模式的情况下,有可能智能语音机器人无法正确识别用户方言中的意图,导致响应出错,造成用户与智能语音机器人之间出现交流障碍,影响人机交互的效果,并且,在智能语音机器人无法一次识别出用户的方言情况下,还会对用户的方言进行多次识别,并提醒用户多次输入语音,这个过程明显增加了用户与智能语音机器人之间的交互次数,进而增加了智能语音机器人侧处理器的负担。

为了解决上述技术问题,本发明提供了一种人机交互方法,通过响应于语音交互触发指令,获取用户的语言类型标识信息;确定与所述语言类型标识信息对应的语言类型,作为目标语言类型;从预先训练的语言交互模型中,选择出与所述目标语言类型对应的语言交互模型,作为目标语言交互模型;基于所述目标语言交互模型所具有的目标语言交互模式,识别用户发出的语音信息,以及向用户发出符合目标语言类型的语音信息。通过基于用户的语言类型标识信息识别出用户的目标语言类型,并基于与目标语言类型对应的目标语言交互模型与用户进行语音交互,使得智能语音机器人使用用户能够识别的语言类型与用户进行交互,避免用户与智能语音机器人之间出现交流障碍,提高人机交互的效果,减少了用户与智能语音机器人之间的交互次数,减轻智能语音机器人侧处理器的负担。

下面对本发明实施例提供的人机交互方法进行介绍,图1为本发明实施例提供的人机交互方法的流程图,该方法可应用于智能语音机器人,参照图1,所述方法可以包括:

步骤s100、响应于语音交互触发指令,获取用户的语言类型标识信息;

需要说明的是,语音交互触发指令为触发用户与智能语音机器人之间进行语音交互的指令,语音交互触发指令可以为用户触发的,还可以为服务器触发的。

基于此,所述响应于语音交互触发指令,获取用户的语言类型标识信息包括:响应于用户触发的语音交互触发指令,或,响应于服务器触发的语音交互触发指令,获取用户的语言类型标识信息。

具体的,在某些场景下,需要用户主动向智能语音机器人发送语音交互触发指令,从而触发用户与智能语音机器人之间的交互,如智能音箱、智能操作终端等,而在某些场景下,则需要服务器主动向智能语音机器人发送语音交互触发指令,如向用户主动拨打的智能电话,具体的,在信贷场景中的催收机器人(相当于智能语音机器人),主要用来实现电话催收的功能,当服务器判断出需要对某个用户执行催收操作的情况下,会将催收信息下发给催收机器人,催收机器人依据催收信息确定所要催收的用户,以及催收内容,然后向所要催收的用户拨打催收电话。

可选的,语言类型标识信息为能够标识用户所用语言类型的标识信息,由于不同的语言类型与地域相关,因此可以依据用户语言类型的标识信息,区分出用户的地域信息,从而依据地域信息确定用户的语言类型。所述语言类型标识信息至少包括:

用户常驻地信息、用户户籍所在地信息、用户号码归属地、用户网络账号归属地、用户业务办理地所在信息、用户历史交互语言以及用户身份标识信息中的至少一种,当然还可以为其他类型的语言类型标识信息,本发明实施例并不做具体限定。用户常驻地信息、用户户籍所在地信息、用户号码归属地、用户网络账号归属地、用户业务办理地所在信息、用户身份标识信息等都是与用户的地域相关的信息。还可以将用户在历史时间段内所采用的用户历史交互语言进行收集保存,作为一种语言类型标识信息。

步骤s110、确定与所述语言类型标识信息对应的语言类型,作为目标语言类型;

本发明实施例通过对语言类型标识信息进行分析,得到语言类型标识信息对应的语言类型,作为目标语言类型,例如,在语言类型标识信息为用户常驻地信息的情况下,可以确定与用户常驻地对应的语言类型。语言类型具体是哪个地方的方言,或者是哪个国家的语言,本发明实施例不做具体限定。

步骤s120、从预先训练的语言交互模型中,选择出与所述目标语言类型对应的语言交互模型,作为目标语言交互模型;

本发明实施例中预先保存了语言类型与语言交互模型的对应关系,根据目标语言类型,即可以选择出对应的语言交互模型。

语言交互模型中存储的是与用户进行语音交互所采用的交互模式,包括了语音识别、意图识别、语音合成技术等,本发明实施例并不做具体限定。不同类型的语言交互模型所采用的交互模式不同,不同类型的语言交互模型所能够识别的语音的语言类型不同,并且能够合成的语音的语言类型也不同。

所述语言交互模型的训练过程包括:

获取不同语言类型的训练语料以及不同语言类型的训练语料各自对应的参考输出语音信息;将所述不同语言类型的训练语料输入到模型中进行训练,得到不同语言类型的训练语料各自对应的预测语音信息;利用所述不同语言类型的训练语料各自对应的参考输出语音信息,以及不同语言类型的训练语料各自对应的预测语音信息,得到语言交互模型的损失函数;利用所述语言交互模型的损失函数对所述语言交互模型的模型参数进行调整;返回执行所述将所述不同语言类型的训练语料输入到模型中进行训练,得到不同语言类型的训练语料各自对应的预测语音信息的步骤继续训练,直至得到语言交互模型的损失函数呈现收敛状况时的语言交互模型的模型参数作为语言交互模型参数,并停止训练。

步骤s130、基于所述目标语言交互模型所具有的目标语言交互模式,识别用户发出的语音信息,以及向用户发出符合目标语言类型的语音信息。

本发明实施例可以基于目标语言交互模型所具有的目标语言交互模式,识别用户发出的语音信息,获取用户发出的语音信息中的目标意图,从而从自身保存的意图与话术的对应关系中,确定与目标意图对应的话术,作为目标话术,并将所述目标话术进行语音合成,得到符合目标语言类型的语音信息。

需要说明的是,在一定场合或情景下说话的技术为话术,话术是与客户意图相关的概念,一个意图往往对应着一个或者多个话术,举例来说,在意图为:我是谁的情况下,对应的话术可以为:你是...,或者,你叫...名字等,本发明实施例不做具体限定。

可选的,本发明实施例还可以基于目标语言交互模型所具有的目标语言交互模式,仅仅识别用户发出的语音信息;同时可还可以基于目标语言交互模型所具有的目标语言交互模式,仅仅向用户发出符合目标语言类型的语音信息。

可选的,本发明实施例还可以获取人机交互效果反馈信息,从而利用人机交互效果反馈信息对本发明实施例中的人机交互方法进行不断迭代优化,形成人机交互方法的闭环控制。

人机交互效果反馈信息可以是用户提供的,还可以是服务器后台采集的,人机交互效果反馈信息例如包括:语音转文字错误信息,用户意图理解错误信息,缺失意图对应的话术等,本发明实施例不做具体限定。

利用人机交互效果反馈信息对本发明实施例中的人机交互方法进行迭代优化的方式如:补充出错部分相关的方言语料,对语言交互模型进行强化训练,补充出错部分相关的文字样本,对用户意图识别模型进行强化训练,补充录制意图对应的缺失话术。

本发明实施例通过响应于语音交互触发指令,获取用户的语言类型标识信息;确定与所述语言类型标识信息对应的语言类型,作为目标语言类型;从预先训练的语言交互模型中,选择出与所述目标语言类型对应的语言交互模型,作为目标语言交互模型;基于所述目标语言交互模型所具有的目标语言交互模式,识别用户发出的语音信息,以及向用户发出符合目标语言类型的语音信息。通过基于用户的语言类型标识信息识别出用户的目标语言类型,并基于与目标语言类型对应的目标语言交互模型与用户进行语音交互,使得智能语音机器人使用用户能够识别的语言类型与用户进行交互,避免用户与智能语音机器人之间出现交流障碍,提高人机交互的效果,减少了用户与智能语音机器人之间的交互次数,减轻智能语音机器人侧处理器的负担。

并且,本发明实施例利用上述技术方案使得智能语音机器人使用用户能够识别的语言类型与用户进行交互,对于不同的用户可以采用不同的语言类型进行交互,从而针对不同的用户实现不同的个性化差异沟通,提高人机交互效率。本发明实施例能够根据不同的用户的语言类型标识信息,采用多种不同的目标语言交互模式与用户进行交互,丰富了语音交互的语言类型,打破了智能语音机器人只采用一种语言类型的模式,例如只采用标准普通话语言类型,拉近与用户的心理距离,提高人机交互的无感率,提高人机对话效果,提高用户感受。

下面本发明实施例提供另一种人机交互方法,图2为本发明实施例提供的另一种人机交互方法的流程图,该方法可应用于智能语音机器人,参照图2,所述方法可以包括:

步骤s200、响应于语音交互触发指令,获取用户的语言类型标识信息;

步骤s210、确定与所述语言类型标识信息对应的语言类型,作为目标语言类型;

步骤s220、从预先训练的语言交互模型中,选择出与所述目标语言类型对应的语言交互模型,作为目标语言交互模型;

本发明实施例中的步骤s200-s220与上述实施例中的步骤s100-s120相同,具体内容可以相互对应参照,在此不做详细论述。

步骤s230、基于所述目标语言交互模型所具有的目标语言交互模式,识别用户发出的语音信息,在基于所述目标语言交互模型所具有的目标语言交互模式,能够识别出用户发出的语音信息的情况下,执行步骤s240;在基于所述目标语言交互模型所具有的目标语言交互模式,无法识别出用户发出的语音信息的情况下,执行如下步骤s250;

步骤s240、获取语音信息识别结果,依据语音信息识别结果向用户发出符合目标语言类型的语音信息;

步骤s250、对用户发出的语音信息进行分析,确定用户发出的语音信息对应的语言类型,作为更新后的目标语言类型;

在基于所述目标语言交互模型所具有的目标语言交互模式,无法识别出用户发出的语音信息的情况下,则说明目标语言交互模型与用户发出的语音信息并不相符,此时则需要重新确定目标语言类型。

具体的可以采用语言类型分析方法,对用户发出的语音信息进行分析,确定用户发出的语音信息对应的语言类型,作为更新后的目标语言类型。例如可以识别用户发出的语音信息具体是哪个地方的方言,或者是哪个国家的语言,本发明实施例不做具体限定。

步骤s260、从预先训练的语言交互模型中,选择出与所述更新后的目标语言类型对应的语言交互模型,作为更新后的目标语言交互模型;

步骤s270、基于所述更新后的目标语言交互模型所具有的更新后的目标语言交互模式,重新识别用户发出的语音信息,以及向用户发出符合更新后的目标语言类型的语音信息。

在重新确定目标语言交互模型之后,可以基于所述更新后的目标语言交互模型所具有的更新后的目标语言交互模式,重新对用户发出的语音信息进行识别,并且可以向用户发出符合更新后的目标语言类型的语音信息。

需要说明的是,本发明实施例在确定目标语言交互模型之后,还可能存在先前依据用户的语言类型标识信息确定的目标语言类型与用户实际发出的语音信息不相符的情况,例如依据用户的常驻地信息识别出的目标语言类型为广东话,而用户实际语音交互过程中发出的语音信息为海南话,广东话的目标语言交互模型则无法识别用户发出的海南话,这种情况下势必会影响人机交互的过程,导致用户与智能语音机器人之间出现交流障碍。

为了避免上述情况的发生,本发明实施例可以对用户发出的语音信息进行分析,依据分析结果对目标语言类型进行更新,得到更新后的目标语言类型,更新后的目标语言类型则是与用户当前对话过程所采用语言类型相符的,进而对目标语言交互模型进行更新,基于更新后的目标语言交互模型所具有的更新后的目标语言交互模式,重新识别用户发出的语音信息,必然能够识别成功,并能够向用户发出符合更新后的目标语言类型的语音信息。进一步避免用户与智能语音机器人之间出现交流障碍,提高人机交互的效果,减少了用户与智能语音机器人之间的交互次数,减轻智能语音机器人侧处理器的负担。

可选的,本发明实施例还包括:接收用户的语言类型输入信息;依据所述语言类型输入信息,确定所述用户的目标语言类型。

用户可以通过主动输入语言类型的方式,使智能语音机器人获知用户的目标语言类型,提高人机交互效率。

下面本发明实施例提供另一种人机交互方法,图3为本发明实施例提供的另一种人机交互方法的流程图,该方法可应用于智能语音机器人,参照图3,所述方法可以包括:

步骤s300、响应于语音交互触发指令,获取用户的语言类型标识信息;

步骤s310、确定与所述语言类型标识信息对应的语言类型,得到多个目标语言类型;

例如在依据用户常驻地信息确定的语言类型与依据用户户籍所在地信息确定的语言类型不同的情况下,得到两个目标语言类型。

步骤s320、向用户提示目标语言类型选择指示信息;

向用户提示目标语言类型选择指示信息的方例如可以通过屏幕显示的方式提示,还可以通过发送信息提醒的方式提示,本发明实施例不做具体限定。

步骤s330、依据用户对目标语言类型的选择指令,从多个目标语言类型中确定最终语言类型;

将确定出的多个目标语言类型提示给用户后,可以接收用户对目标语言类型的选择指令,从而多个目标语言类型中确定一个最终语言类型。

步骤s340、从预先训练的语言交互模型中,选择出与所述最终语言类型对应的语言交互模型,作为目标语言交互模型;

步骤s350、基于所述目标语言交互模型所具有的目标语言交互模式,识别用户发出的语音信息,以及向用户发出符合目标语言类型的语音信息。

本发明实施例在确定的用户的目标语言类型为多个的情况下,可以通过向用户提示目标语言类型选择指示信息的方式,让用户选择一个最终语言类型,进一步提高确定语言类型的准确性,避免用户与智能语音机器人之间出现交流障碍,提高人机交互的效果,减少了用户与智能语音机器人之间的交互次数,减轻智能语音机器人侧处理器的负担。并且,提高用户感受。

下面以一个具体的信贷应用场景详细说明本发明实施例中的技术方案:

本发明实施例在信贷场景中设置了方言版催收机器人(相当于智能语音机器人),方言版催收机器人是事先按照地域语言特征,针对性的训练出的能够听懂客户的常驻地方言,并且能够用用户常驻地进行对话的一种催收机器人,主要用来实现电话催收的功能,当服务器判断出需要对某个用户执行催收操作的情况下,会将催收信息下发给方言版催收机器人,方言版催收机器人执行以下操作:

1、响应于服务器触发的语音交互触发指令,获取用户的语言类型标识信息(如常驻地、信贷业务办理地、用户户籍所在地、用户号码归属地、用户网络账号归属地、用户历史交互语言以及用户身份标识信息中的至少一种);

2、确定与所述语言类型标识信息对应的语言类型,作为目标语言类型;

3、从预先训练的语言交互模型中,选择出与所述目标语言类型对应的语言交互模型,作为目标语言交互模型;

4、基于所述目标语言交互模型所具有的目标语言交互模式,识别用户发出的语音信息,以及向用户发出符合目标语言类型的语音信息,主要按照用户的方言向用户播报信贷业务中的逾期业务、逾期金额、逾期天数等信息。

通过基于用户的语言类型标识信息识别出用户的目标语言类型,并基于与目标语言类型对应的目标语言交互模型与用户进行语音交互,使得目标语言交互模型使用用户能够识别的语言类型与用户进行交互,即实现方言版催收机器人使用用户能够识别的方言与用户进行交流,实现不同的用户群体采用不同的个性化差异沟通方式;方言版催收机器人根据用户语言习惯,采用合适的方言,可以拉近心理距离,避免用户与智能语音机器人之间出现交流障碍,最终提升催收业务效果;针对不同的客户采用语调各不相同的方言,能够提高人机对话过程中的无感率。当方言版催收机器人听不懂用户的话或者用户主动要求说普通话时,方言版催收机器人可以迅速地切换到标准普通话进行作业,避免了可能出现语言问题导致无法正常沟通。

下面对本发明实施例提供的人机交互装置进行介绍,下文描述的人机交互装置可与上文人机交互方法相互对应参照。

图4为本发明实施例提供的人机交互装置的结构框图,该人机交互装置具体可以为智能语音机器人,参照图4,该人机交互装置可以包括:

标识信息获取单元400,用于响应于语音交互触发指令,获取用户的语言类型标识信息;

目标语言类型确定单元410,用于确定与所述语言类型标识信息对应的语言类型,作为目标语言类型;

目标语言交互模型确定单元420,用于从预先训练的语言交互模型中,选择出与所述目标语言类型对应的语言交互模型,作为目标语言交互模型;

交互单元430,用于基于所述目标语言交互模型所具有的目标语言交互模式,识别用户发出的语音信息,以及向用户发出符合目标语言类型的语音信息。

可选的,在基于所述目标语言交互模型所具有的目标语言交互模式,无法识别出用户发出的语音信息的情况下,所述人机交互装置还包括:

语音分析单元,用于对用户发出的语音信息进行分析,确定用户发出的语音信息对应的语言类型,作为更新后的目标语言类型;

模型更新单元,用于从预先训练的语言交互模型中,选择出与所述更新后的目标语言类型对应的语言交互模型,作为更新后的目标语言交互模型;

重交互单元,用于基于所述更新后的目标语言交互模型所具有的更新后的目标语言交互模式,重新识别用户发出的语音信息,以及向用户发出符合更新后的目标语言类型的语音信息。

可选的,所述人机交互装置还包括:模型训练单元,所述模型训练单元具体用于:

获取不同语言类型的训练语料以及不同语言类型的训练语料各自对应的参考输出语音信息;

将所述不同语言类型的训练语料输入到模型中进行训练,得到不同语言类型的训练语料各自对应的预测语音信息;

利用所述不同语言类型的训练语料各自对应的参考输出语音信息,以及不同语言类型的训练语料各自对应的预测语音信息,得到语言交互模型的损失函数;

利用所述语言交互模型的损失函数对所述语言交互模型的模型参数进行调整;

返回执行所述将所述不同语言类型的训练语料输入到模型中进行训练,得到不同语言类型的训练语料各自对应的预测语音信息的步骤继续训练,直至得到语言交互模型的损失函数呈现收敛状况时的语言交互模型的模型参数作为语言交互模型参数,并停止训练。

在确定的用户的目标语言类型为多个的情况下,所述装置还包括:

语言类型选择提示单元,用于向用户提示目标语言类型选择指示信息;

最终语言类型确定单元,用于依据用户对目标语言类型的选择指令,从多个目标语言类型中确定最终语言类型。

可选的,目标语言交互模型确定单元具体用于:

从预先训练的语言交互模型中,选择出与所述最终语言类型对应的语言交互模型,作为目标语言交互模型。

可选的,所述人机交互装置还用于:

接收用户的语言类型输入信息;

依据所述语言类型输入信息,确定所述用户的目标语言类型。

可选的,所述标识信息获取单元具体用于:

响应于用户触发的语音交互触发指令,或,响应于服务器触发的语音交互触发指令,获取用户的语言类型标识信息。

所述语言类型标识信息至少包括:

用户常驻地信息、用户户籍所在地信息、用户号码归属地、用户网络账号归属地、用户业务办理地所在信息、用户历史交互语言以及用户身份标识信息中的至少一种。

可选的,本发明实施例还公开了一种智能交互终端,该智能交互终端具体可以为智能语音机器人,该智能交互终端包括:存储器和处理器;

所述存储器用于存储计算机程序;

所述处理器用于执行所述存储器中存储的计算机程序;

所述计算机程序用于执行如上所述的人机交互方法。

本说明书中各个实施例中记载的技术特征可以相互替换或组合,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips