用于智能语音机器人的语义识别方法、装置及电子设备与流程
2021-01-28 14:01:51|300|起点商标网
本公开涉及计算机信息处理领域,具体而言,涉及一种用于智能语音机器人的语义识别方法、装置、电子设备及计算机可读介质。
背景技术:
::随着近年定义和产业分工越发精细,语音识别渐渐分成了语音识别和语义识别两个支系。语音和语义虽然只有一字之差,但却是天壤之别。语音识别相当于人的耳朵,而语义识别则是大脑,语音识别能够帮助智能机器人获取信息,而语义识别则是对这些信息进行加工以帮助智能机器人分析进而输出信息以进行人机交互。其中,语义识别是自然语言处理(nlp)技术的重要组成部分之一,语义识别的核心除了理解文本词汇的含义,还要理解这个词语在语句、篇章中所代表的意思,这意味着语义识别从技术上要做到:文本、词汇、句法、词法、篇章(段落)层面的语义分析和歧义消除,以及对应的含义重组,以达到识别本身的目的。可包括以语言学、计算机语言等学科为背景的,对自然语言进行词语解析、信息抽取、时间因果、情绪判断等等技术处理,最终达到让计算机“懂”人类的语言的自然语言认知,以及把计算机数据转化为自然语言的自然语言生成。但是,由于人类说话的方式千差万别,目前语义识别只能对较为简单的短句进行分析处理,面对长句或者包含多个层次含义的复杂句式,语义识别的结果常常不尽人意。在所述
背景技术:
:部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。技术实现要素:有鉴于此,本公开提供一种用于智能语音机器人的语义识别方法、装置、电子设备及计算机可读介质,能够在用户的语音信息中包含复杂句式和长句的情况下,也能快速准确的对用户的语义进行识别和分析,进而更好地为用户提供智能机器人的语音交互服务。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一方面,提出一种用于智能语音机器人的语义识别方法,该方法包括:获取来自用户的语音信息;在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;基于所述至少一个简化文本对所述语音信息进行语义识别。可选地,还包括:根据语义识别的结果生成返回信息;所述智能语音机器人基于所述返回信息与所述用户进行语音交互。可选地,在所述语音信息满足预设策略时,包括:实时对所述语音信息进行文字识别;在文字识别结果中文字数量大于阈值时,确定所述语音信息满足预设策略。可选地,将所述语音信息输入增强学习模型中,包括:将所述语音信息进行语音识别,生成原文本信息;将所述原文本信息输入所述增强学习模型中。可选地,所述增强学习模型的奖励参数,包括:文本的流畅度,文本的相似性,文本的信息熵。可选地,所述增强学习模型对所述语音信息进行计算生成至少一个简化文本,包括:所述增强学习模型对所述原文本信息中的文字进行分句处理以生成至少一个简化文本;和/或所述增强学习模型对所述原文本信息中的文字进行换词处理以生成所述至少一个简化文本。可选地,所述增强学习模型对所述语音信息进行计算生成至少一个简化文本,包括:所述增强学习模型基于所述原文本信息确定初始状态;基于所述初始状态,增强学习模型随机选择动作方向进行计算;根据计算结果确定奖励参数;根据所述奖励参数确定计算方向以生成所述至少一个简化文本。可选地,根据计算结果确定奖励参数,包括:根据计算结果生成当前文本的流畅度、和当前文本的信息熵;将所述当前文本和所述原文本信息进行比较生成原本文信息与当前文本的相似性;根据所述前文本的流畅度,所述当前文本的信息熵,原文本信息与当前文本的相似性确定当前奖励参数。可选地,根据计算结果生成当前文本的流畅度,包括:通过solr算法和/或bleu算法确定所述当前文本的流畅度。可选地,根据所述奖励参数确定计算方向以生成所述至少一个简化文本,包括:在所述奖励参数大于等于阈值时,确定计算方向为第一方向;在所述奖励参数小于阈值时,确定计算方向为第二方向;所述增强学习模型基于第一方向或第二方向继续进行计算以生成所述至少一个简化文本。根据本公开的一方面,提出一种用于智能语音机器人的语义识别装置,该装置包括:语音模块,用于获取来自用户的语音信息;策略模块,用于在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;计算模块,用于所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;识别模块,用于基于所述至少一个简化文本对所述语音信息进行语义识别。可选地,还包括:交互模块,用于根据语义识别的结果生成返回信息;所述智能语音机器人基于所述返回信息与所述用户进行语音交互。可选地,所述策略模块,包括:判断单元,用于实时对所述语音信息进行文字识别;在文字识别结果中文字数量大于阈值时,确定所述语音信息满足预设策略。可选地,所述策略模块,包括:输入单元,用于将所述语音信息进行语音识别,生成原文本信息;将所述原文本信息输入所述增强学习模型中。可选地,所述增强学习模型的奖励参数,包括:文本的流畅度,文本的相似性,文本的信息熵。可选地,所述计算模块,包括:分句单元,用于所述增强学习模型对所述原文本信息中的文字进行分句处理以生成至少一个简化文本;和/或换词单元,用于所述增强学习模型对所述原文本信息中的文字进行换词处理以生成所述至少一个简化文本。可选地,所述计算模块,还包括:初始单元,用于所述增强学习模型基于所述原文本信息确定初始状态;动作单元,用于基于所述初始状态,增强学习模型随机选择动作方向进行计算;奖励单元,用于根据计算结果确定奖励参数;简化单元,用于根据所述奖励参数确定计算方向以生成所述至少一个简化文本。可选地,所述奖励单元,还用于根据计算结果生成当前文本的流畅度、和当前文本的信息熵;将所述当前文本和所述原文本信息进行比较生成原本文信息与当前文本的相似性;根据所述前文本的流畅度,所述当前文本的信息熵,原文本信息与当前文本的相似性确定当前奖励参数。可选地,所述奖励单元,还用于通过solr算法和/或bleu算法确定所述当前文本的流畅度。可选地,所述简化单元,还用于在所述奖励参数大于等于阈值时,确定计算方向为第一方向;在所述奖励参数小于阈值时,确定计算方向为第二方向;所述增强学习模型基于第一方向或第二方向继续进行计算以生成所述至少一个简化文本。根据本公开的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。根据本公开的一方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。根据本公开的用于智能语音机器人的语义识别方法、装置、电子设备及计算机可读介质,获取来自用户的语音信息;在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;基于所述至少一个简化文本对所述语音信息进行语义识别的方式,能够在用户的语音信息中包含复杂句式和长句的情况下,也能快速准确的对用户的语义进行识别和分析,进而更好地为用户提供智能机器人的语音交互服务。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。附图说明通过参照附图详细描述其示例实施例,本公开的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据一示例性实施例示出的一种用于智能语音机器人的语义识别方法及装置的系统框图。图2是根据一示例性实施例示出的一种用于智能语音机器人的语义识别方法的流程图。图3是根据另一示例性实施例示出的一种用于智能语音机器人的语义识别方法的流程图。图4是根据另一示例性实施例示出的一种用于智能语音机器人的语义识别方法的示意图。图5是根据一示例性实施例示出的一种用于智能语音机器人的语义识别装置的框图。图6是根据一示例性实施例示出的一种电子设备的框图。图7是根据一示例性实施例示出的一种计算机可读介质的框图。具体实施方式现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本公开所必须的,因此不能用于限制本公开的保护范围。图1是根据一示例性实施例示出的一种用于智能语音机器人的语义识别方法及装置的系统框图。如图1所示,系统架构10可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送语音消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如金融服务类应用、购物类应用、网页浏览器应用、即时通信工具、邮箱客户端、社交平台软件等。终端设备101、102、103可以是支持语音传输的各种电子设备,包括但不限于固定电话、智能手机、平板电脑、膝上型便携计算机和台式计算机等等。服务器105在用户处可呈现为一个智能语音机器人的形式,服务器105可以是为用户提供各种语音交互服务的服务器,可对用户利用终端设备101、102、103所传输的语音信息进行分析的服务器。服务器105可以对接收到的语音信息进行分析等处理,并将处理结果(例如语义识别结果或返回信息)反馈给终端设备101、102、103。服务器105可例如获取来自用户的语音信息;服务器105可例如在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;服务器105可例如所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;服务器105可例如基于所述至少一个简化文本对所述语音信息进行语义识别。服务器105还可例如根据语义识别的结果生成返回信息;所述智能语音机器人基于所述返回信息与所述用户进行语音交互。服务器105可以是一个实体的服务器,还可例如为多个服务器组成,服务器105中的一部分可例如获取来自用户的语音信息;并判断所述语音信息是否满足预设策略,服务器105中的一部分还可例如将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;进而进行计算生成至少一个简化文本;服务器105中的一部分还可例如基于所述至少一个简化文本对所述语音信息进行语义识别,并根据语义识别的结果生成返回信息。需要说明的是,本公开实施例所提供的用于智能语音机器人的语义识别方法可以由服务器105执行,相应地,用于智能语音机器人的语义识别装置可以设置于服务器105中。图2是根据一示例性实施例示出的一种用于智能语音机器人的语义识别方法的流程图。用于智能语音机器人的语义识别方法20至少包括步骤s202至s208。如图2所示,在s202中,获取来自用户的语音信息。智能语音机器人可用在任何人机交互的场景中,智能语音机器人可为一个实体的设备,可例如设置在办公大厦的前台处提供给用户一般咨询帮助,还可例如设置在商场超市的货架处,提供给用户查询类的帮助,智能语音机器人还可例如为一个虚拟的语音设施,可例如作为客服负责接听用户的语音信息,还可例如作为咨询热线的导引员,负责对用户进行一般指引,本公开不以此为限。智能语音机器人为虚拟语音设施时,可通过用户的呼叫,和用户建立通信连接以获取用户的语音信息,智能语音机器人为实体设备时,其自身可安装语音接收的麦克风或者其他收音设备,通过这些设备直接获取用户的语音信息。在s204中,在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数。其中,所述增强学习模型的奖励参数,包括:文本的流畅度,文本的相似性,文本的信息熵。更具体的,在本公开的实施例中,增强学习模型会对用户的语音信息进行处理,生成简化的文本信息,增强学习模型的奖励参数中的文本的相似性指的是:原始输入的语音信息(原始文本信息)和增强学习模型输出的简化文本信息之间的文本相似性;奖励参数中的文本的流畅度指的是:简化文本中的文字的流畅程度,其用词语句是否符合语法规则;文本的信息熵指的是简化文本中包含的信息的多少,一般情况下,越是无规则的文本信息,其包含的信息熵越大,越是具体的信息其包含的信息熵越小。其中,可例如,实时对所述语音信息进行文字识别;在文字识别结果中文字数量大于阈值时,确定所述语音信息满足预设策略。在一般情况下,通过语音识别之后的文本信息可直接进行语义识别,这种方式可以节约语音信息的处理时间,但是,在语音信息包含的文字较多时,可通过本公开中的增强学习模型对语音信息进行处理。文字信息的阈值可通过经验值设定。其中,将所述语音信息输入增强学习模型中,具体包括:将所述语音信息进行语音识别,生成原文本信息;将所述原文本信息输入所述增强学习模型中。在s206中,增强学习模型对所述语音信息进行计算生成至少一个简化文本。包括:所述增强学习模型对所述原文本信息中的文字进行分句处理以生成至少一个简化文本;和/或所述增强学习模型对所述原文本信息中的文字进行换词处理以生成所述至少一个简化文本。更具体的,增强学习模型可将原文本信息中的复杂的语句进行拆分,生成多个简单的语句,每个语句只包含一个语义,后续智能语音机器人可逐一对每个语句进行语义理解,然后再综合多个语句进行分析处理;增强学习模型还可将原文本信息中的生僻字或者生僻词替换为常见词汇以便于后续智能语音机器人进行语义理解。“增强学习模型对所述语音信息进行计算生成至少一个简化文本”的具体内容将在图3,4对应的实施例中进行详细描述。在s208中,基于所述至少一个简化文本对所述语音信息进行语义识别。在一个实施例中,还包括:根据语义识别的结果生成返回信息;所述智能语音机器人基于所述返回信息与所述用户进行语音交互。根据本公开的用于智能语音机器人的语义识别方法,获取来自用户的语音信息;在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;基于所述至少一个简化文本对所述语音信息进行语义识别的方式,能够在用户的语音信息中包含复杂句式和长句的情况下,也能快速准确的对用户的语义进行识别和分析,进而更好地为用户提供智能机器人的语音交互服务。应清楚地理解,本公开描述了如何形成和使用特定示例,但本公开的原理不限于这些示例的任何细节。相反,基于本公开公开的内容的教导,这些原理能够应用于许多其它实施例。图3是根据另一示例性实施例示出的一种用于智能语音机器人的语义识别方法的流程图。图3所示的流程30是对图2所示的流程中s206“增强学习模型对所述语音信息进行计算生成至少一个简化文本”的详细描述。强化学习(reinforcementlearning,rl),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。本公开中使用的强化学习模型可为标准的马尔可夫决策过程(markovdecisionprocess,mdp)。本公开中求解强化学习问题所使用的算法可为策略搜索算法和值函数(valuefunction)算法两类。强化学习模型不同于监督学习和非监督学习,强化学习不要求预先给定任何数据,而是通过接收环境对动作的奖励(反馈)获得学习信息并更新模型参数。如图3所示,在s302中,增强学习模型基于所述原文本信息确定初始状态。可随机设定初始的状态,即为随机在原文本信息中选择几个文字为一组的划分方式作为强化学习的初始状态。强化学习是智能体以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,由于外部环境提供的信息很少,增强学习模型必须靠自身的经历进行学习。通过这种方式,增强学习模型在行动评价的环境中获得知识,改进行动方案以适应环境。在s304中,基于所述初始状态,增强学习模型随机选择动作方向进行计算。如果某个行为策略导致环境正的奖赏(强化信号),那么以后产生这个行为策略的趋势便会加强。增强学习模型的目标是在每个离散状态发现最优策略以使期望的折扣奖赏和最大。强化学习把学习看作试探评价过程,增强学习模型选择一个动作用于环境,环境接受该动作后状态发生变化,同时产生一个强化信号(奖或惩)反馈给增强学习模型,增强学习模型根据强化信号和环境当前状态再选择下一个动作,选择的原则是使受到正强化(奖)的概率增大。选择的动作不仅影响立即强化值,而且影响环境下一时刻的状态及最终的强化值。在s306中,根据计算结果确定奖励参数。包括:根据计算结果生成当前文本的流畅度、和当前文本的信息熵;将所述当前文本和所述原文本信息进行比较生成原本文信息与当前文本的相似性;根据所述前文本的流畅度,所述当前文本的信息熵,原文本信息与当前文本的相似性确定当前奖励参数。更进一步的,可通过solr算法和/或bleu算法确定所述当前文本的流畅度。还可通过余弦相似度算法确定原本文信息与当前文本的相似性,还可通过shannon公式计算信息熵,shannon公式中借鉴了热力学的概念,把信息中排除了冗余后的平均信息量称为“信息熵”。更具体的,bleu(bilingualevaluationunderstudy,双语评估替补),意思是代替人进行翻译结果的评估,它可以用于评估一组自然语言处理任务生成的文本。在自然语言处理中的机器翻译任务中,bleu用于评估模型生成的句子(candidare)和实际句子(reference)的差异的指标。它的取值范围在0.0到1.0之间,如果两个句子完美匹配(perfectmatch),那么bleu是1.0,反之,如果两个句子完美不匹配(perfectmismatch),那么bleu为0.0。在s308中,根据所述奖励参数确定计算方向以生成所述至少一个简化文本。包括:在所述奖励参数大于等于阈值时,确定计算方向为第一方向;在所述奖励参数小于阈值时,确定计算方向为第二方向;所述增强学习模型基于第一方向或第二方向继续进行计算以生成所述至少一个简化文本。如图4所示的表格,可以为每一个状态(state)上进行的每一个动作(action)计算出最大的未来奖励(reward)的期望。得益于这个表格,可以知道为每一个状态采取的最佳动作。其中,每个状态(方块)允许四种可能的操作:左移、右移、上移、下移。「0」代表不可能的移动(如果你在左上角,你不可能向左移动或者向上移动)。在计算过程中,可以将这个网格转换成一个表。这种表格被称为q-table(「q」代表动作的「质量」)。每一列将代表四个操作(左、右、上、下),行代表状态。每个单元格的值代表给定状态和相应动作的最大未来奖励期望。每个q-table的分数将代表在给定最佳策略的状态下采取相应动作获得的最大未来奖励期望。可通过寻找每一行中最高的分数,可以知道对于每一个状态(q-table中的每一行)来说,可采取的最佳动作是什么。根据每一行的最佳状态,即可知道原始文本的最佳简化状态,即获取简化文本。本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由cpu执行的计算机程序。在该计算机程序被cpu执行时,执行本公开提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。此外,需要注意的是,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。图5是根据一示例性实施例示出的一种用于智能语音机器人的语义识别装置的框图。如图5所示,用于智能语音机器人的语义识别装置50包括:语音模块502,策略模块504,计算模块506,识别模块508,交互模块510。语音模块502用于获取来自用户的语音信息;策略模块504用于在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;所述增强学习模型的奖励参数,包括:文本的流畅度,文本的相似性,文本的信息熵。所述策略模块504具体可包括:判断单元,用于实时对所述语音信息进行文字识别;在文字识别结果中文字数量大于阈值时,确定所述语音信息满足预设策略。输入单元,用于将所述语音信息进行语音识别,生成原文本信息;将所述原文本信息输入所述增强学习模型中。计算模块506用于所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;所述计算模块506包括:分句单元,用于所述增强学习模型对所述原文本信息中的文字进行分句处理以生成至少一个简化文本;换词单元,用于所述增强学习模型对所述原文本信息中的文字进行换词处理以生成所述至少一个简化文本。识别模块508用于基于所述至少一个简化文本对所述语音信息进行语义识别。用于智能语音机器人的语义识别装置50还可包括:交互模块510用于根据语义识别的结果生成返回信息;所述智能语音机器人基于所述返回信息与所述用户进行语音交互。根据本公开的用于智能语音机器人的语义识别装置,获取来自用户的语音信息;在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;基于所述至少一个简化文本对所述语音信息进行语义识别的方式,能够在用户的语音信息中包含复杂句式和长句的情况下,也能快速准确的对用户的语义进行识别和分析,进而更好地为用户提供智能机器人的语音交互服务。图6是根据一示例性实施例示出的一种电子设备的框图。下面参照图6来描述根据本公开的这种实施方式的电子设备600。图6显示的电子设备600仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。如图6所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同系统组件(包括存储单元620和处理单元610)的总线630、显示单元640等。其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元610执行,使得所述处理单元610执行本说明书上述电子处方流转处理方法部分中描述的根据本公开各种示例性实施方式的步骤。例如,所述处理单元610可以执行如图2,图3中所示的步骤。所述存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(rom)6203。所述存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。电子设备600也可以与一个或多个外部设备600’(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,如图7所示,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本公开实施方式的上述方法。所述软件产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言-诸如java、c++等,还包括常规的过程式程序设计语言-诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现如下功能:获取来自用户的语音信息;在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;基于所述至少一个简化文本对所述语音信息进行语义识别。本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施例的方法。以上具体地示出和描述了本公开的示例性实施例。应可理解的是,本公开不限于这里描述的详细结构、设置方式或实现方法;相反,本公开意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。当前第1页1 2 3 当前第1页1 2 3 
背景技术:
::随着近年定义和产业分工越发精细,语音识别渐渐分成了语音识别和语义识别两个支系。语音和语义虽然只有一字之差,但却是天壤之别。语音识别相当于人的耳朵,而语义识别则是大脑,语音识别能够帮助智能机器人获取信息,而语义识别则是对这些信息进行加工以帮助智能机器人分析进而输出信息以进行人机交互。其中,语义识别是自然语言处理(nlp)技术的重要组成部分之一,语义识别的核心除了理解文本词汇的含义,还要理解这个词语在语句、篇章中所代表的意思,这意味着语义识别从技术上要做到:文本、词汇、句法、词法、篇章(段落)层面的语义分析和歧义消除,以及对应的含义重组,以达到识别本身的目的。可包括以语言学、计算机语言等学科为背景的,对自然语言进行词语解析、信息抽取、时间因果、情绪判断等等技术处理,最终达到让计算机“懂”人类的语言的自然语言认知,以及把计算机数据转化为自然语言的自然语言生成。但是,由于人类说话的方式千差万别,目前语义识别只能对较为简单的短句进行分析处理,面对长句或者包含多个层次含义的复杂句式,语义识别的结果常常不尽人意。在所述
背景技术:
:部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。技术实现要素:有鉴于此,本公开提供一种用于智能语音机器人的语义识别方法、装置、电子设备及计算机可读介质,能够在用户的语音信息中包含复杂句式和长句的情况下,也能快速准确的对用户的语义进行识别和分析,进而更好地为用户提供智能机器人的语音交互服务。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一方面,提出一种用于智能语音机器人的语义识别方法,该方法包括:获取来自用户的语音信息;在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;基于所述至少一个简化文本对所述语音信息进行语义识别。可选地,还包括:根据语义识别的结果生成返回信息;所述智能语音机器人基于所述返回信息与所述用户进行语音交互。可选地,在所述语音信息满足预设策略时,包括:实时对所述语音信息进行文字识别;在文字识别结果中文字数量大于阈值时,确定所述语音信息满足预设策略。可选地,将所述语音信息输入增强学习模型中,包括:将所述语音信息进行语音识别,生成原文本信息;将所述原文本信息输入所述增强学习模型中。可选地,所述增强学习模型的奖励参数,包括:文本的流畅度,文本的相似性,文本的信息熵。可选地,所述增强学习模型对所述语音信息进行计算生成至少一个简化文本,包括:所述增强学习模型对所述原文本信息中的文字进行分句处理以生成至少一个简化文本;和/或所述增强学习模型对所述原文本信息中的文字进行换词处理以生成所述至少一个简化文本。可选地,所述增强学习模型对所述语音信息进行计算生成至少一个简化文本,包括:所述增强学习模型基于所述原文本信息确定初始状态;基于所述初始状态,增强学习模型随机选择动作方向进行计算;根据计算结果确定奖励参数;根据所述奖励参数确定计算方向以生成所述至少一个简化文本。可选地,根据计算结果确定奖励参数,包括:根据计算结果生成当前文本的流畅度、和当前文本的信息熵;将所述当前文本和所述原文本信息进行比较生成原本文信息与当前文本的相似性;根据所述前文本的流畅度,所述当前文本的信息熵,原文本信息与当前文本的相似性确定当前奖励参数。可选地,根据计算结果生成当前文本的流畅度,包括:通过solr算法和/或bleu算法确定所述当前文本的流畅度。可选地,根据所述奖励参数确定计算方向以生成所述至少一个简化文本,包括:在所述奖励参数大于等于阈值时,确定计算方向为第一方向;在所述奖励参数小于阈值时,确定计算方向为第二方向;所述增强学习模型基于第一方向或第二方向继续进行计算以生成所述至少一个简化文本。根据本公开的一方面,提出一种用于智能语音机器人的语义识别装置,该装置包括:语音模块,用于获取来自用户的语音信息;策略模块,用于在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;计算模块,用于所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;识别模块,用于基于所述至少一个简化文本对所述语音信息进行语义识别。可选地,还包括:交互模块,用于根据语义识别的结果生成返回信息;所述智能语音机器人基于所述返回信息与所述用户进行语音交互。可选地,所述策略模块,包括:判断单元,用于实时对所述语音信息进行文字识别;在文字识别结果中文字数量大于阈值时,确定所述语音信息满足预设策略。可选地,所述策略模块,包括:输入单元,用于将所述语音信息进行语音识别,生成原文本信息;将所述原文本信息输入所述增强学习模型中。可选地,所述增强学习模型的奖励参数,包括:文本的流畅度,文本的相似性,文本的信息熵。可选地,所述计算模块,包括:分句单元,用于所述增强学习模型对所述原文本信息中的文字进行分句处理以生成至少一个简化文本;和/或换词单元,用于所述增强学习模型对所述原文本信息中的文字进行换词处理以生成所述至少一个简化文本。可选地,所述计算模块,还包括:初始单元,用于所述增强学习模型基于所述原文本信息确定初始状态;动作单元,用于基于所述初始状态,增强学习模型随机选择动作方向进行计算;奖励单元,用于根据计算结果确定奖励参数;简化单元,用于根据所述奖励参数确定计算方向以生成所述至少一个简化文本。可选地,所述奖励单元,还用于根据计算结果生成当前文本的流畅度、和当前文本的信息熵;将所述当前文本和所述原文本信息进行比较生成原本文信息与当前文本的相似性;根据所述前文本的流畅度,所述当前文本的信息熵,原文本信息与当前文本的相似性确定当前奖励参数。可选地,所述奖励单元,还用于通过solr算法和/或bleu算法确定所述当前文本的流畅度。可选地,所述简化单元,还用于在所述奖励参数大于等于阈值时,确定计算方向为第一方向;在所述奖励参数小于阈值时,确定计算方向为第二方向;所述增强学习模型基于第一方向或第二方向继续进行计算以生成所述至少一个简化文本。根据本公开的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。根据本公开的一方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。根据本公开的用于智能语音机器人的语义识别方法、装置、电子设备及计算机可读介质,获取来自用户的语音信息;在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;基于所述至少一个简化文本对所述语音信息进行语义识别的方式,能够在用户的语音信息中包含复杂句式和长句的情况下,也能快速准确的对用户的语义进行识别和分析,进而更好地为用户提供智能机器人的语音交互服务。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。附图说明通过参照附图详细描述其示例实施例,本公开的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据一示例性实施例示出的一种用于智能语音机器人的语义识别方法及装置的系统框图。图2是根据一示例性实施例示出的一种用于智能语音机器人的语义识别方法的流程图。图3是根据另一示例性实施例示出的一种用于智能语音机器人的语义识别方法的流程图。图4是根据另一示例性实施例示出的一种用于智能语音机器人的语义识别方法的示意图。图5是根据一示例性实施例示出的一种用于智能语音机器人的语义识别装置的框图。图6是根据一示例性实施例示出的一种电子设备的框图。图7是根据一示例性实施例示出的一种计算机可读介质的框图。具体实施方式现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本公开所必须的,因此不能用于限制本公开的保护范围。图1是根据一示例性实施例示出的一种用于智能语音机器人的语义识别方法及装置的系统框图。如图1所示,系统架构10可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送语音消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如金融服务类应用、购物类应用、网页浏览器应用、即时通信工具、邮箱客户端、社交平台软件等。终端设备101、102、103可以是支持语音传输的各种电子设备,包括但不限于固定电话、智能手机、平板电脑、膝上型便携计算机和台式计算机等等。服务器105在用户处可呈现为一个智能语音机器人的形式,服务器105可以是为用户提供各种语音交互服务的服务器,可对用户利用终端设备101、102、103所传输的语音信息进行分析的服务器。服务器105可以对接收到的语音信息进行分析等处理,并将处理结果(例如语义识别结果或返回信息)反馈给终端设备101、102、103。服务器105可例如获取来自用户的语音信息;服务器105可例如在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;服务器105可例如所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;服务器105可例如基于所述至少一个简化文本对所述语音信息进行语义识别。服务器105还可例如根据语义识别的结果生成返回信息;所述智能语音机器人基于所述返回信息与所述用户进行语音交互。服务器105可以是一个实体的服务器,还可例如为多个服务器组成,服务器105中的一部分可例如获取来自用户的语音信息;并判断所述语音信息是否满足预设策略,服务器105中的一部分还可例如将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;进而进行计算生成至少一个简化文本;服务器105中的一部分还可例如基于所述至少一个简化文本对所述语音信息进行语义识别,并根据语义识别的结果生成返回信息。需要说明的是,本公开实施例所提供的用于智能语音机器人的语义识别方法可以由服务器105执行,相应地,用于智能语音机器人的语义识别装置可以设置于服务器105中。图2是根据一示例性实施例示出的一种用于智能语音机器人的语义识别方法的流程图。用于智能语音机器人的语义识别方法20至少包括步骤s202至s208。如图2所示,在s202中,获取来自用户的语音信息。智能语音机器人可用在任何人机交互的场景中,智能语音机器人可为一个实体的设备,可例如设置在办公大厦的前台处提供给用户一般咨询帮助,还可例如设置在商场超市的货架处,提供给用户查询类的帮助,智能语音机器人还可例如为一个虚拟的语音设施,可例如作为客服负责接听用户的语音信息,还可例如作为咨询热线的导引员,负责对用户进行一般指引,本公开不以此为限。智能语音机器人为虚拟语音设施时,可通过用户的呼叫,和用户建立通信连接以获取用户的语音信息,智能语音机器人为实体设备时,其自身可安装语音接收的麦克风或者其他收音设备,通过这些设备直接获取用户的语音信息。在s204中,在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数。其中,所述增强学习模型的奖励参数,包括:文本的流畅度,文本的相似性,文本的信息熵。更具体的,在本公开的实施例中,增强学习模型会对用户的语音信息进行处理,生成简化的文本信息,增强学习模型的奖励参数中的文本的相似性指的是:原始输入的语音信息(原始文本信息)和增强学习模型输出的简化文本信息之间的文本相似性;奖励参数中的文本的流畅度指的是:简化文本中的文字的流畅程度,其用词语句是否符合语法规则;文本的信息熵指的是简化文本中包含的信息的多少,一般情况下,越是无规则的文本信息,其包含的信息熵越大,越是具体的信息其包含的信息熵越小。其中,可例如,实时对所述语音信息进行文字识别;在文字识别结果中文字数量大于阈值时,确定所述语音信息满足预设策略。在一般情况下,通过语音识别之后的文本信息可直接进行语义识别,这种方式可以节约语音信息的处理时间,但是,在语音信息包含的文字较多时,可通过本公开中的增强学习模型对语音信息进行处理。文字信息的阈值可通过经验值设定。其中,将所述语音信息输入增强学习模型中,具体包括:将所述语音信息进行语音识别,生成原文本信息;将所述原文本信息输入所述增强学习模型中。在s206中,增强学习模型对所述语音信息进行计算生成至少一个简化文本。包括:所述增强学习模型对所述原文本信息中的文字进行分句处理以生成至少一个简化文本;和/或所述增强学习模型对所述原文本信息中的文字进行换词处理以生成所述至少一个简化文本。更具体的,增强学习模型可将原文本信息中的复杂的语句进行拆分,生成多个简单的语句,每个语句只包含一个语义,后续智能语音机器人可逐一对每个语句进行语义理解,然后再综合多个语句进行分析处理;增强学习模型还可将原文本信息中的生僻字或者生僻词替换为常见词汇以便于后续智能语音机器人进行语义理解。“增强学习模型对所述语音信息进行计算生成至少一个简化文本”的具体内容将在图3,4对应的实施例中进行详细描述。在s208中,基于所述至少一个简化文本对所述语音信息进行语义识别。在一个实施例中,还包括:根据语义识别的结果生成返回信息;所述智能语音机器人基于所述返回信息与所述用户进行语音交互。根据本公开的用于智能语音机器人的语义识别方法,获取来自用户的语音信息;在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;基于所述至少一个简化文本对所述语音信息进行语义识别的方式,能够在用户的语音信息中包含复杂句式和长句的情况下,也能快速准确的对用户的语义进行识别和分析,进而更好地为用户提供智能机器人的语音交互服务。应清楚地理解,本公开描述了如何形成和使用特定示例,但本公开的原理不限于这些示例的任何细节。相反,基于本公开公开的内容的教导,这些原理能够应用于许多其它实施例。图3是根据另一示例性实施例示出的一种用于智能语音机器人的语义识别方法的流程图。图3所示的流程30是对图2所示的流程中s206“增强学习模型对所述语音信息进行计算生成至少一个简化文本”的详细描述。强化学习(reinforcementlearning,rl),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。本公开中使用的强化学习模型可为标准的马尔可夫决策过程(markovdecisionprocess,mdp)。本公开中求解强化学习问题所使用的算法可为策略搜索算法和值函数(valuefunction)算法两类。强化学习模型不同于监督学习和非监督学习,强化学习不要求预先给定任何数据,而是通过接收环境对动作的奖励(反馈)获得学习信息并更新模型参数。如图3所示,在s302中,增强学习模型基于所述原文本信息确定初始状态。可随机设定初始的状态,即为随机在原文本信息中选择几个文字为一组的划分方式作为强化学习的初始状态。强化学习是智能体以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,由于外部环境提供的信息很少,增强学习模型必须靠自身的经历进行学习。通过这种方式,增强学习模型在行动评价的环境中获得知识,改进行动方案以适应环境。在s304中,基于所述初始状态,增强学习模型随机选择动作方向进行计算。如果某个行为策略导致环境正的奖赏(强化信号),那么以后产生这个行为策略的趋势便会加强。增强学习模型的目标是在每个离散状态发现最优策略以使期望的折扣奖赏和最大。强化学习把学习看作试探评价过程,增强学习模型选择一个动作用于环境,环境接受该动作后状态发生变化,同时产生一个强化信号(奖或惩)反馈给增强学习模型,增强学习模型根据强化信号和环境当前状态再选择下一个动作,选择的原则是使受到正强化(奖)的概率增大。选择的动作不仅影响立即强化值,而且影响环境下一时刻的状态及最终的强化值。在s306中,根据计算结果确定奖励参数。包括:根据计算结果生成当前文本的流畅度、和当前文本的信息熵;将所述当前文本和所述原文本信息进行比较生成原本文信息与当前文本的相似性;根据所述前文本的流畅度,所述当前文本的信息熵,原文本信息与当前文本的相似性确定当前奖励参数。更进一步的,可通过solr算法和/或bleu算法确定所述当前文本的流畅度。还可通过余弦相似度算法确定原本文信息与当前文本的相似性,还可通过shannon公式计算信息熵,shannon公式中借鉴了热力学的概念,把信息中排除了冗余后的平均信息量称为“信息熵”。更具体的,bleu(bilingualevaluationunderstudy,双语评估替补),意思是代替人进行翻译结果的评估,它可以用于评估一组自然语言处理任务生成的文本。在自然语言处理中的机器翻译任务中,bleu用于评估模型生成的句子(candidare)和实际句子(reference)的差异的指标。它的取值范围在0.0到1.0之间,如果两个句子完美匹配(perfectmatch),那么bleu是1.0,反之,如果两个句子完美不匹配(perfectmismatch),那么bleu为0.0。在s308中,根据所述奖励参数确定计算方向以生成所述至少一个简化文本。包括:在所述奖励参数大于等于阈值时,确定计算方向为第一方向;在所述奖励参数小于阈值时,确定计算方向为第二方向;所述增强学习模型基于第一方向或第二方向继续进行计算以生成所述至少一个简化文本。如图4所示的表格,可以为每一个状态(state)上进行的每一个动作(action)计算出最大的未来奖励(reward)的期望。得益于这个表格,可以知道为每一个状态采取的最佳动作。其中,每个状态(方块)允许四种可能的操作:左移、右移、上移、下移。「0」代表不可能的移动(如果你在左上角,你不可能向左移动或者向上移动)。在计算过程中,可以将这个网格转换成一个表。这种表格被称为q-table(「q」代表动作的「质量」)。每一列将代表四个操作(左、右、上、下),行代表状态。每个单元格的值代表给定状态和相应动作的最大未来奖励期望。每个q-table的分数将代表在给定最佳策略的状态下采取相应动作获得的最大未来奖励期望。可通过寻找每一行中最高的分数,可以知道对于每一个状态(q-table中的每一行)来说,可采取的最佳动作是什么。根据每一行的最佳状态,即可知道原始文本的最佳简化状态,即获取简化文本。本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由cpu执行的计算机程序。在该计算机程序被cpu执行时,执行本公开提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。此外,需要注意的是,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。图5是根据一示例性实施例示出的一种用于智能语音机器人的语义识别装置的框图。如图5所示,用于智能语音机器人的语义识别装置50包括:语音模块502,策略模块504,计算模块506,识别模块508,交互模块510。语音模块502用于获取来自用户的语音信息;策略模块504用于在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;所述增强学习模型的奖励参数,包括:文本的流畅度,文本的相似性,文本的信息熵。所述策略模块504具体可包括:判断单元,用于实时对所述语音信息进行文字识别;在文字识别结果中文字数量大于阈值时,确定所述语音信息满足预设策略。输入单元,用于将所述语音信息进行语音识别,生成原文本信息;将所述原文本信息输入所述增强学习模型中。计算模块506用于所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;所述计算模块506包括:分句单元,用于所述增强学习模型对所述原文本信息中的文字进行分句处理以生成至少一个简化文本;换词单元,用于所述增强学习模型对所述原文本信息中的文字进行换词处理以生成所述至少一个简化文本。识别模块508用于基于所述至少一个简化文本对所述语音信息进行语义识别。用于智能语音机器人的语义识别装置50还可包括:交互模块510用于根据语义识别的结果生成返回信息;所述智能语音机器人基于所述返回信息与所述用户进行语音交互。根据本公开的用于智能语音机器人的语义识别装置,获取来自用户的语音信息;在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;基于所述至少一个简化文本对所述语音信息进行语义识别的方式,能够在用户的语音信息中包含复杂句式和长句的情况下,也能快速准确的对用户的语义进行识别和分析,进而更好地为用户提供智能机器人的语音交互服务。图6是根据一示例性实施例示出的一种电子设备的框图。下面参照图6来描述根据本公开的这种实施方式的电子设备600。图6显示的电子设备600仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。如图6所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同系统组件(包括存储单元620和处理单元610)的总线630、显示单元640等。其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元610执行,使得所述处理单元610执行本说明书上述电子处方流转处理方法部分中描述的根据本公开各种示例性实施方式的步骤。例如,所述处理单元610可以执行如图2,图3中所示的步骤。所述存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(rom)6203。所述存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。电子设备600也可以与一个或多个外部设备600’(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,如图7所示,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本公开实施方式的上述方法。所述软件产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言-诸如java、c++等,还包括常规的过程式程序设计语言-诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现如下功能:获取来自用户的语音信息;在所述语音信息满足预设策略时,将所述语音信息输入增强学习模型中,并设定所述增强学习模型的奖励参数;所述增强学习模型对所述语音信息进行计算生成至少一个简化文本;基于所述至少一个简化文本对所述语音信息进行语义识别。本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施例的方法。以上具体地示出和描述了本公开的示例性实施例。应可理解的是,本公开不限于这里描述的详细结构、设置方式或实现方法;相反,本公开意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。当前第1页1 2 3 当前第1页1 2 3 
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除
热门咨询
tips