语音语义信息提取方法、装置、智能终端及存储介质与流程

2021-01-28 16:01:28|

292|

起点商标网

本发明涉及语音识别技术领域，尤其涉及的是一种语音语义信息提取方法、装置、智能终端及存储介质。

背景技术：

随着人工智能的不断发展，使得语音交互应用越来越普及。人工智能电子设备已经拥有了强大的处理能力，可以实现在一定程度上像人类一样理解自然语言。

现有的人工电子设备在理解自然语言时一般通过直接与大数据匹配进行语音语义信息提取，但是大数据混杂不同领域，会造成匹配结果与本身想要表达的内容产生偏差，导致语音语义理解错误。

因此，现有技术还有待于改进和发展。

技术实现要素：

本发明要解决的技术问题在于，针对现有技术的上述缺陷，提供一种语音语义信息提取方法、装置、智能终端及存储介质，旨在解决现有技术中语音语义理解精确度不高的问题。

本发明解决技术问题所采用的技术方案如下：

第一方面，本发明实施例提供一种语音语义信息提取方法，包括：

获取语音信息以及不同业务领域信息；

分析所述语音信息对应不同所述业务领域的匹配数据，比对所述匹配数据得出业务领域分类结果；

基于所述业务领域分类结果进行语义信息提取。

通过上述方法，使得所述语音信息在语义提取之前根据不同的业务领域信息进行业务领域分类，以确定所述语音信息内容对应的业务领域，再基于确认的业务领域针对性的进行语义提取，避免了语音信息混杂了不同业务领域的语义段使得语义信息混乱导致不能提取出正确的语义信息，从而提高了语音语义信息提取的精确度。

在一种实施方案中，所述分析所述语音信息对应不同所述业务领域的匹配数据，包括：

基于不同的所述业务领域信息分别对所述语音信息进行分块，得到不同的分块信息；

匹配所述分块信息与对应的所述业务领域信息，得出匹配数据。

通过将所述语音信息分别对应不同业务领域的进行分块，使得一个语音信息被多块化形成分块信息，将分块信息中的每一个分块与业务领域信息比对，得出匹配数据，使得匹配数据更加准确，同时依据不同的业务领域进行语音信息分块得到不同领域的分块信息，使得该分块信息更加合理。

在一种实施方案中，所述基于不同的所述业务领域信息分别对所述语音信息进行分块，得到不同的分块信息，包括：

转化所述语音信息为文本信息；

基于不同的所述业务领域信息分别对所述文本信息对应进行字段分块，得到所述分块信息。

通过将语音信息先转化为文本信息，以文本的方式进行业务领域确定，相较于语音来说稳定性也会比较好，匹配数据也会比较稳定。

在一种实施方案中，所述基于不同的所述业务领域信息分别对所述文本信息对应进行字段分块，得到不同的分块信息，包括：

基于不同的所述业务领域信息分别对所述文本信息对应进行字段分块；

对所述字段分块进行纠错；

基于所述纠错得出所述分块信息。

首先将所述语音信息转化的文字信息根据不同的业务领域进行字段分块，使得所述字段的分块与业务领域更加匹配，然后再对应不同的业务领域分别对字段分块进行纠错，使得纠错结果对于各自的业务领域来说更加合理。

在一种实施方案中，所述领域信息包括领域标志信息块，匹配所述分块信息与对应的所述业务领域信息，得出匹配数据，包括：比对所述分块信息与所述领域标志信息块的重叠情况，得出匹配数据。

在一种实施方案中，所述基于所述业务领域分类结果进行语义信息提取，包括：

基于所述业务领域分类结果获取对应的业务领域提取规则；

基于所述业务领域提取规则提取所述分块信息的关键段；

基于所述关键段得出语义信息。

通过提取关键段忽略掉与语义无关的修饰词或者其他无异议词语，排除干扰，提高语义提取精度。

在一种实施方案中，所述基于所述领域分类结果进行语义信息提取，之后还包括：

基于所述业务领域分类结果获取业务处理信息；

基于所述业务处理信息进行所述语义信息业务处理。

可以针对语义信息进行业务处理，提高业务处理的效率，且可广泛运用与多种业务领域。

第二方面，本发明实施例还提供一种语音语义信息提取装置，包括：

语音获取模块，用于获取语音信息；

业务领域信息获取模块，获取不同业务领域信息；

分析比对模块，用于分析所述语音信息对应不同所述业务领域的匹配数据，并比对所述匹配数据得出业务领域分类结果；

语义信息提取，用于基于所述业务领域分类结果进行语义信息提取。

通过语音获取模块、业务领域信息获取模块、分析比对模块以及语义信息提取模块对语音信息进行领域确认并根据确认领域进行语音语义信息提取，保证语音语义提取信息的精确度。

第三方面，本发明实施例还提供一种智能终端，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行如上述任意一项所述语音语义信息提取方法。

第四方面，本发明实施例还提供一种计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如上述任意一项所述语音语义信息提取方法。

本发明的有益效果：本发明通过对语音信息进行分析比对，确认语音信息内容所涉及的业务领域，然后通过基于确认的技术领域进行语音语义信息提取。避免了语音信息混杂了不同业务领域的语义段使得语义信息混乱导致不能提取出正确的语义信息，从而提高了语音语义信息提取的精确度。

附图说明

图1是本发明提供的语音语义信息提取方法的一种实施例的流程图；

图2是本发明提供的语音语义信息提取方法的一种实施例中步骤s100的流程图；

图3是本发明提供的语音语义信息提取方法的一种实施例中步骤s200的流程图；

图4是本发明提供的语音语义信息提取方法的一种实施例中步骤s300的流程图；

图5本发明提供的语音语义信息提取方法的一种实施例中步骤s400的流程图；

图6是本发明提供的语音语义信息提取装置的功能原理图。

图7是本发明提供的智能终端的功能原理图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明提供的一种语音语义信息提取方法，该方法可应用在智能终端。智能终端可以但不限于是各种个人计算机、笔记本电脑、手机、平板电脑、车载电脑、ai机器人、电视机和便携式可穿戴设备。本发明的智能终端采用多核处理器。其中，终端的处理器可以为中央处理器(centralprocessingunit，cpu)，图形处理器(graphicsprocessingunit，gpu)、视频处理单元(videoprocessingunit，vpu)等中的至少一种。

随着科技的发展，语音已经成为了智能终端最常见的交互和输入方式，越来越多的设备通过语音进行设备的控制，通过语音进行文字的录入。

当前单终端使用场景下，语音指令的识别率已经非常高，而要进行大段的语义理解识别率确始终不理想，自然语言时一般通过直接与大数据词典匹配进行语音语义信息提取，但是大数据词典混杂不同领域，会造成匹配结果与本身想要表达的内容产生偏差，导致语音语义理解混乱造成理解错误。比如：用户通过智能终端的麦克风设备，输入语音/用户拨打语音客服服务电话，客服语音电话接通后，用户进行语音输入。如：“我买的一台电视出了一点故障，播放在线视频的时候黑屏了，怎么办？”语音客服的通过语音识别模块将语音转换成文字并进行语义提取，可能语义识别的结果为：“我买的一台点事除了一点鼓掌，播放在线食品的时候黑屏了，怎么办？”。由此可见，现有的语音语义提取结果还是受到语音识别数据业务领域混杂的影响，存在精确度不高的问题。

本发明通过对语音信息进行分析比对，确认语音信息内容所涉及的业务领域，然后通过基于确认的技术领域进行语音语义信息提取。避免了语音信息混杂了不同业务领域的语义段使得语义信息混乱导致不能提取出正确的语义信息，从而提高了语音语义信息提取的精确度。可以广泛运用于智能电视语音交互、智能填表、智能会议语音识别、语音关键信息比对、aiot领域语音控制、智能酒店服务等需要获取用户关键点信息的业务场景。

下面结合附图，详细说明本发明的各种非限制性实施方式。

示例性方法

参见图1，本实施例提供一种语音语义信息提取方法，包括如下步骤：

步骤s100：获取语音信息以及不同业务领域信息。

具体的，参见图2，步骤s100还包括：

步骤s101：获取语音信息；

步骤s102：访问带有自动更新功能的业务领域数据库获取业务领域信息。

具体的，所述语音信息可根据语音采集设备进行采集获取，比如手机麦克风、电脑麦克风或者ai机器人语音采集话筒等设备，比如通过ai机器人的语音采集设备输入语音信息“我买的一台电视出了一点故障，播放在线视频的时候黑屏了，怎么办？”

进一步的，所述业务领域信息可通过访问路径或网址访问网页或者存储在存储器内的业务领域数据库，业务领域数据库包括不同的信息领域知识库以及与信息领域知识库一一对应的信息提取规则库。

步骤s200：分析所述语音信息对应不同所述业务领域的匹配数据，比对所述匹配数据得出业务领域分类结果。

具体的，参见图3，所述步骤s200包括：

步骤s201：转化所述语音信息为文本信息；

也就是将语音信息转换为文字信息，比如将上述的语音信息：“我买的一台电视出了一点故障，播放在线视频的时候黑屏了，怎么办？”转化为文本信息：“我买的一台点事除了一点鼓掌，播放在线食品的时候黑屏了，怎么办？”方便后续操作。

步骤s202：基于不同的所述业务领域信息分别对所述文本信息对应进行字段分块，对所述字段分块进行纠错，基于所述纠错得出所述分块信息。

具体的，所述业务领域信息包括至少两个不同业务领域的信息，所述业务领域信息通过访问路径访问不同的信息领域知识库获取，所述信息领域知识库里面分别包括对应领域的词库，该词库包括同一语义的不同文本信息。比如电视业务领域的信息领域知识库里的词库可能会包含对应“电视”的词语“点事”、“垫石”、“电石”等词汇，该些词汇是通过词库的ai训练结果知道的，所述业务领域数据库也会通过ai训练进行对所述业务领域数据库的更新和优化。在本实施例中，其训练的内容来自业务数据服务器；业务数据服务器存储业务领域数据库。语义知识库ai训练模块根据业务的大数据，进行ai训练，ai训练的内容为各业务的领域识别及信息归集规则，将领域和规则发送给规则知识库，规则知识库进行更新。通过将所述将文本信息与不同的信息领域知识库的词库进行匹配得到分块信息，由于该分块信息是对应不同领域得到的，所以该分块信息相对于各领域来说是更加的合理和准确的，也不会发生信息混乱。比如，根据上述文本信息对应电视业务领域进行分块信息为：【我】【买了】【一台】【点事】【除了】【一点】【鼓掌】【播放】【在线食品】【的】【时候】【黑屏】【了】【怎么办】，根据电视业务领域的信息领域知识库词典得知【点事】＝电视、【鼓掌】＝故障、【在线食品】＝在线视频进行纠错。但是在其他业务领域可能就会不同的识别结果，比如是在食物业务领域，可能会将电视业务领域的分块【在线食品】分块为【在线】【食品】，【食品】就会被认定为正确文本跳过纠错，导致纠错结果也就产生不同，进而影响语音语义提取结果。

步骤s203：匹配所述分块信息与对应的所述业务领域信息，得出匹配数据。

步骤s204：比对所述匹配数据得出业务领域分类结果；

具体的，所述信息领域知识库包括领域标志信息块，该所述领域信息标志块可包括领域内的关键词组，比如电视业务领域的关键词组可设置为【电视】【视屏显示】【黑屏】【播放】等关键词组，且一般为名词或者业务领域内标准的常见内容识别词语。在本实施方案中，通过比对所述分块信息与所述领域标志信息块的重叠情况，比如说，比对电视领域得出词组重叠为6组，比对食品领域得出词组重叠为2组，以此方法得出个领域的重叠组数，得出匹配数据；比对重叠组数最高的为语音内容确定的业务领域，进而提升语音语义提取的精确度。

步骤s300：基于所述业务领域分类结果进行语义信息提取；

具体的，参见图4，所述步骤s300包括：

步骤s301：基于所述业务领域分类结果获取对应的业务领域提取规则；

具体的，所述信息提取规则库包括不同的业务领域提取规则，在本申请中，通过确定的技术领域针对性地提取对应的业务领域提取规则，可通过网络实现数据传输获取，也可直接从预设的包括有信息提取规则库的存储器获取等。针对性的进行数据提取，节省不必要的数据传输和处理步骤，避免程序浪费和/或流量浪费。

步骤s302：基于所述业务领域提取规则提取所述分块信息的关键段；

步骤s303：基于所述关键段得出语义信息。

具体的，该关键字段提取规则可通过提取名词提取、动词提取或清单填报规则等等提取规则进行提取，实现关键信息以及必要信息的提取，省去不必要的词组，避免对语义理解造成干扰，进而得到语义信息。

参见图5，步骤s400：基于所述业务领域分类结果获取业务处理信息；基于所述业务处理信息进行所述语义信息业务处理。

具体的，业务处理时根据语义信息，例如：清单需要包含电话号码(缺)、产品类别(电视)、机器型号(缺)、故障现象(播放在线视频黑屏)、解决方案(方案文字，该文字方案包括在业务处理信息内)、服务评价(缺)创建客服工单，将客服工单缺失信息必要项目反馈给客户端进行资料补充，然后下发解决方案，完成业务处理。

例如：语音客服语音播放【您反馈的在线视频播放黑屏的故障我们已经收到】；

语音客服语音播放【为了更好的解决您的问题，请提供您的电视型号】；用户语音：led55ai。语音客服语音播放【您的电视型号为：led55a1，请您确认】，电视型号led55a1的信息直接通过信息提取的字段精准识别，如识别不到继续引导用户提供型号，填充到问题反馈的电视型号信息中。用户语音：【确认】。

语音客服语音播放【您可以通过手机或者语音获取解决方案，请选择】。用户语音：手机，则播报6.5；语音，则播报6.4。

【以下是该故障的解决办法，请查收】，语音客服语音播放【故障解决方案语音播报】

语音客服语音播放【该方案可以通过手机短信的形式发送到你的手机，请提供您的手机号码】，用户语音：13988888888。语音客服语音播放【您的电话号码为13988888888，解决方案已经下发，请查收】。

语音客服语音播放【请对我们的服务做出评价】，用户语音评价。将评价语音转换文字填充到对应工单保存。

在保障了业务处理的准确性以及快速性，减少业务错误。

通过上述方法，使得所述语音信息在语义提取之前根据不同的业务领域信息进行业务领域分类，以确定所述语音信息内容对应的业务领域，再基于确认的业务领域针对性的进行语义提取，避免了语音信息混杂了不同业务领域的语义段使得语义信息混乱导致不能提取出正确的语义信息，从而提高了语音语义信息提取的精确度。提高了业务水平。

示例性设备

参见图6，本发明实施例提供一种语音语义信息提取装置，该装置包括：

获取模块100，获取语音信息以及不同业务领域信息；

分析比对模块200，用于分析所述语音信息对应不同所述业务领域的匹配数据，并比对所述匹配数据得出业务领域分类结果；

语义信息提取模块300，用于基于所述业务领域分类结果进行语义信息提取。

业务处理模块400：用于基于所述业务领域分类结果获取业务处理信息；基于所述业务处理信息进行所述语义信息业务处理。

基于上述实施例，本发明还提供了一种智能终端，其原理框图可以如图7所示。该智能终端包括通过系统总线连接的处理器、存储器、网络接口、显示屏、语音采集话筒。其中，该智能终端的处理器用于提供计算和控制能力。该智能终端的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该智能终端的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现种语音语义信息提取方法。该智能终端的显示屏可以是液晶显示屏或者电子墨水显示屏，该智能终端的温度传感器是预先在智能终端内部设置，用于检测内部设备的当前运行温度。

本领域技术人员可以理解，图7中示出的原理框图，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的智能终端的限定，具体的智能终端可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种智能终端，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

获取语音信息以及不同业务领域信息；

转化所述语音信息为文本信息；

基于不同的所述业务领域信息分别对所述文本信息对应进行字段分块，对所述字段分块进行纠错，基于所述纠错得出所述分块信息；

比对所述匹配数据得出业务领域分类结果；

匹配所述分块信息与对应的所述业务领域信息，得出匹配数据；

基于所述业务领域分类结果获取对应的业务领域提取规则；

基于所述业务领域提取规则提取所述分块信息的关键段；

基于所述关键段得出语义信息。

进一步的，在另一种实施例中，在上述实施指令之后还包括用于进行以下操作的指令：

基于所述业务领域分类结果获取业务处理信息；基于所述业务处理信息进行所述语义信息业务处理。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限，ram以多种形式可得，诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

综上所述，本发明公开了语音语义信息提取方法、装置、智能终端及存储介质，所述方法包括：获取语音信息以及不同业务领域信息；分析所述语音信息对应不同所述业务领域的匹配数据，比对所述匹配数据得出业务领域分类结果；基于所述业务领域分类结果进行语义信息提取。本发明不但避免了语音语义提取时进去度不高，不能有效地识别到语义信息的问题，有助于提高语音语义提取的准确度。

应当理解的是，本发明的应用不限于上述的举例，对本领域普通技术人员来说，可以根据上述说明加以改进或变换，所有这些改进和变换都应属于本发明所附权利要求的保护范围。

起点商标作为专业知识产权交易平台，可以帮助大家解决很多问题，如果大家想要了解更多知产交易信息请点击【在线咨询】或添加微信【19522093243】与客服一对一沟通，为大家解决相关问题。