HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

一种数据处理方法、装置、设备及介质与流程

2021-01-28 14:01:09|276|起点商标网
一种数据处理方法、装置、设备及介质与流程

本申请涉及人工智能中的语音处理技术,尤其涉及一种数据处理方法、装置、设备及介质。



背景技术:

目前在很多行业内都会使用到视频机器人通话,例如服务行业中的业务咨询、业务办理等,视频机器人通话已经开始逐渐取代人工,且可以实现随时随地的业务办理。在用户呼叫视频机器人时,通常是根据用户需要办理的业务的不同来对接不同的识别引擎,通过识别引擎进行业务处理。由于不同的业务需要由不同的服务器来处理,视频机器人需要承载较多的业务属性才能实现对接不同的识别引擎,每种业务均需要定制开发不同的识别引擎,浪费大量资源,且成本较高。



技术实现要素:

本申请实施例提供一种数据处理方法、装置、设备及介质,可避免资源浪费,降低成本。

本申请实施例一方面提供一种数据处理方法,包括:

从终端中获取关于第一业务的第一多媒体数据;

对该第一多媒体数据进行识别,得到该第一业务属性信息,该第一业务属性信息包括该第一业务的业务等级或者该第一业务的业务收益中的至少一种;

从共享识别引擎集合中确定与该第一业务属性信息匹配的识别引擎,作为目标识别引擎;

输出关于处理该第一业务的提示信息;

从该终端中获取针对该提示信息所发送的第二多媒体数据;

将该第二多媒体数据发送至第一业务平台,以使该第一业务平台采用该目标识别引擎对该第二多媒体数据进行识别,处理该第一业务。

可选的,该第一多媒体数据包括第一语音数据,该对该第一多媒体数据进行识别,得到该第一业务属性信息,包括:对该第一语音数据进行语音识别,得到该第一语音数据中与业务相关联的第一关键词,根据该第一关键词确定该第一业务属性信息;或者,对该第一语音数据进行转换,得到该第一语音数据对应的第一文本数据;对该第一文本数据进行关键词提取,得到该第一文本数据中与业务相关联的第二关键词;根据该第二关键词确定该第一业务属性信息。

可选的,该第一业务属性信息包括该第一业务的业务等级;该从共享识别引擎集合中确定与该第一业务属性信息匹配的识别引擎,作为目标识别引擎,包括:获取该共享识别引擎集合中的识别引擎的识别等级,该识别引擎的识别等级用于反映该识别引擎识别多媒体数据的准确度;将该共享识别引擎集合中识别等级与该第一业务的业务等级匹配的识别引擎,确定为该目标识别引擎。

可选的,该第一业务属性信息包括该第一业务的业务收益,该从共享识别引擎集合中确定与该第一业务属性信息匹配的识别引擎,作为目标识别引擎,包括:获取该共享识别引擎集合中的识别引擎的识别成本;将该共享识别引擎集合中识别成本与该第一业务的业务收益匹配的识别引擎,确定为该目标识别引擎。

可选的,该第二多媒体数据包括第一视频数据和第二语音数据;该将该第二多媒体数据发送至第一业务平台,以使该第一业务平台采用该目标识别引擎对该第二多媒体数据进行识别,处理该第一业务,包括:根据该第一视频数据获取该终端对应的用户的第一图像;将该第一图像、该第一视频数据以及该第二语音数据发送至该第一业务平台,以使该第一业务平台根据该第一图像验证该终端的合法性,在该终端具有合法性时,采用该目标识别引擎对该第一视频数据以及第二语音数据进行识别,处理该第一业务。

可选的,该方法还包括:若获取到该第一业务平台发送的用于指示该终端不具有合法性的警示信息,则输出用于指示该用户进行姿态调整的调整信息;获取该终端针对该调整信息发送的第三多媒体数据,该第三多媒体数据包括第三视频数据;根据该第三视频数据获取该用户的第二图像;将该第二图像发送至该第一业务平台,以使该第一业务平台根据该第二图像验证该终端的合法性。

本申请实施例一方面提供一种数据处理装置,包括:

第一获取模块,用于从终端中获取关于第一业务的第一多媒体数据;

数据识别模块,用于对该第一多媒体数据进行识别,得到该第一业务属性信息,该第一业务属性信息包括该第一业务的业务等级或者该第一业务的业务收益中的至少一种;

引擎确定模块,用于从共享识别引擎集合中确定与该第一业务属性信息匹配的识别引擎,作为目标识别引擎;

信息输出模块,用于输出关于处理该第一业务的提示信息;

第二获取模块,用于从该终端中获取针对该提示信息所发送的第二多媒体数据;

业务处理模块,用于将该第二多媒体数据发送至第一业务平台,以使该第一业务平台采用该目标识别引擎对该第二多媒体数据进行识别,处理该第一业务。

可选的,该信息输出模块,用于根据该第一业务的标识确定处理该第一业务平台;从该第一业务平台中获取关于处理该第一业务的提示信息;输出该第一提示信息。

可选的,该第一多媒体数据包括第一语音数据,该数据识别模块,具体用于对该第一语音数据进行语音识别,得到该第一语音数据中与业务相关联的第一关键词,根据该第一关键词确定该第一业务属性信息;或者,对该第一语音数据进行转换,得到该第一语音数据对应的第一文本数据;对该第一文本数据进行关键词提取,得到该第一文本数据中与业务相关联的第二关键词;根据该第二关键词确定该第一业务属性信息。

可选的,该第一业务属性信息包括该第一业务的业务等级;该引擎确定模块,具体用于获取该共享识别引擎集合中的识别引擎的识别等级,该识别引擎的识别等级用于反映该识别引擎识别多媒体数据的准确度;将该共享识别引擎集合中识别等级与该第一业务的业务等级匹配的识别引擎,确定为该目标识别引擎。

可选的,该第一业务属性信息包括该第一业务的业务收益;该引擎确定模块,具体用于获取该共享识别引擎集合中的识别引擎的识别成本;将该共享识别引擎集合中识别成本与该第一业务的业务收益匹配的识别引擎,确定为该目标识别引擎。

可选的,该第二多媒体数据包括第一视频数据和第二语音数据;该业务处理模块,具体用于根据该第一视频数据获取该终端对应的用户的第一图像;将该第一图像、该第一视频数据以及该第二语音数据发送至该第一业务平台,以使该第一业务平台根据该第一图像验证该终端的合法性,在该终端具有合法性时,采用该目标识别引擎对该第一视频数据以及第二语音数据进行识别,处理该第一业务。

可选的,该装置还包括:调整模块,用于若获取到该第一业务平台发送的用于指示该终端不具有合法性的警示信息,则输出用于指示该用户进行姿态调整的调整信息;获取该终端针对该调整信息发送的第三多媒体数据,该第三多媒体数据包括第三视频数据;根据该第三视频数据获取该用户的第二图像;将该第二图像发送至该第一业务平台,以使该第一业务平台根据该第二图像验证该终端的合法性。

本申请一方面提供了一种计算机设备,包括:处理器、存储器、网络接口;

上述处理器与存储器、网络接口相连,其中,网络接口用于提供数据通信功能,上述存储器用于存储计算机程序,上述处理器用于调用上述计算机程序,以执行本申请实施例中上述一方面中的方法。

本申请实施例一方面提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令当被处理器执行时使该处理器执行上述第一方面的基于区块链的数据处理方法。

本申请实施例中,通过对第一多媒体数据进行识别,可以获取到与第一业务对应的第一业务属性信息。通过确定第一业务对应的目标识别引擎,在后续处理第一业务时,使用该目标识别引擎进行识别,处理第一业务。由于共享识别引擎集合中包括多个识别引擎,即该种方式可以将多个识别引擎集中在共享识别引擎集合中,不同业务均可共享该集合中的识别引擎,不需要为不同业务定制识别引擎,可以避免资源浪费,节省硬件资源的投入,从而节省成本。进一步的,输出关于处理第一业务的提示信息,从终端中获取针对提示信息所发送的第二多媒体数据,通过输出提示信息,终端可以采集用户根据该提示信息进行回复得到的第二多媒体数据。将第二多媒体数据发送至第一业务平台,以使第一业务平台采用目标识别引擎对第二多媒体数据进行识别,处理第一业务。在用户需要进行业务办理时,只需要通过获取多媒体数据中的业务属性信息,确定对应的业务以及业务对应的识别引擎,将第一业务对应的多媒体数据发送至第一业务平台,第一业务平台即可采用对应的识别引擎进行识别,处理第一业务。可以实现将确定识别引擎和处理业务两种流程进行分离,实现快速对接到业务处理平台进行业务处理。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种数据处理方法的流程示意图;

图2是本申请实施例提供的一种数据处理方法的流程示意图;

图3是本申请实施例提供的一种数据处理装置的组成结构示意图;

图4是本申请实施例提供的一种计算机设备的组成结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

其中,语音处理技术(speechtechnology)的关键技术有自动语音识别技术(asr)和语音合成技术(tts)以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。

本申请涉及人工智能中的语音处理技术,利用语音处理技术对关于第一业务的第一多媒体数据进行识别,得到第一业务属性信息,从共享识别引擎集合中确定与第一业务属性信息匹配的目标识别引擎,将第二多媒体数据发送至第一业务平台,以使第一业务平台使用目标识别引擎对第二多媒体数据进行识别,处理第一业务。由于本申请中不同业务均可共享该集合中的识别引擎,不需要为不同业务定制识别引擎,可以避免资源浪费,节省硬件资源的投入,从而节省成本。本申请可适用于智慧政务、智慧教育等领域,有利于推动智慧城市的建设。

本申请的技术方案适用于对终端发送的多媒体数据进行识别,从而根据多媒体数据中的业务属性信息进行相应的业务处理的场景中。例如本申请的技术方案适用于远程面审、视频回访、远程开户等场景中,通过从终端中获取关于第一业务的第一多媒体数据,对第一多媒体数据进行识别,得到第一业务的属性信息,根据属性信息确定出与属性信息匹配的目标识别引擎,输出关于处理第一业务的提示信息,以使终端根据该提示信息发送第二多媒体数据,通过将第二多媒体数据发送至第一业务对应的业务平台,以使业务平台采用目标识别引擎识别第二多媒体数据,处理第一业务。通过对包含业务的多媒体数据进行识别,可以确定多媒体数据中的业务属性信息,从而根据业务属性信息办理相应业务。

请参见图1,图1是本申请实施例提供的一种数据处理方法的流程示意图,该方法可以应用于计算机设备,其中,计算机设备包括手机、平板电脑、笔记本电脑、掌上电脑、智能音响、移动互联网设备(mid,mobileinternetdevice)、pos(pointofsales,销售点)机、可穿戴设备(例如智能手表、智能手环等)等;还可以是指是一台独立的服务器、或由若干台服务器组成的服务器集群、或云计算中心。如图1所示,该方法包括:

s101,从终端中获取关于第一业务的第一多媒体数据。

这里,终端可以是指用户用于进行业务处理的终端。终端可以包括手机、平板电脑、笔记本电脑、掌上电脑、智能音响、移动互联网设备(mid,mobileinternetdevice)、pos(pointofsales,销售点)机、可穿戴设备(例如智能手表、智能手环等)等。第一业务可以包括用户需要办理的业务,例如购买xx产险、银行贷款、银行卡办理、信用卡办理,等等。或者,第一业务也可以包括用户需要的服务,例如银行卡余额查询、信用卡额度查询,等等。第一多媒体数据可以包括语音数据类型、视频数据类型,等等。

具体实现中,用户可以通过终端发送呼叫请求,计算机设备获取到该呼叫请求,根据该呼叫请求建立与终端之间的通话连接,通过该通话连接从终端中获取关于第一业务的第一多媒体数据。这里,通话连接可以包括视频连接、语音连接,等等。视频连接用于获取与计算机设备连接的终端发送的视频数据、语音连接用于获取与计算机设备连接的终端发送的语音数据。

s102,对第一多媒体数据进行识别,得到第一业务属性信息。

这里,第一多媒体数据中包含与第一业务对应的关键词,计算机设备可以对第一多媒体数据进行识别,识别到第一多媒体数据中包含与第一业务对应的关键词,则将该关键词作为第一业务属性信息。例如,第一多媒体数据例如可以为“我要办理信用卡”,则识别到的关键词包括“办理”、“信用卡”,则第一属性信息包括“办理”、“信用卡”。

s103,从共享识别引擎集合中确定与第一业务属性信息匹配的识别引擎,作为目标识别引擎。

这里,识别引擎用于对多媒体数据进行识别。共享识别引擎集合中包括至少一个识别引擎,共享识别引擎集合中可以包括识别多种业务对应的多媒体数据的识别引擎。其中,一种业务可以对应多种识别引擎,例如可以包含语音数据识别引擎、文本数据识别引擎、面部数据识别引擎,等等。一种识别引擎也可以识别多种业务。与第一业务属性信息匹配的识别引擎是指可以识别第一业务对应的多媒体数据的识别引擎。例如,第一业务属性信息为“办理信用卡”,则第一业务可以为“办理信用卡”,则与第一业务属性信息匹配的识别引擎是指可以识别“办理信用卡”对应的多媒体数据的识别引擎,也就是说,识别引擎可以识别用户办理信用卡填写的文本信息、语音数据,等等。例如,用户需要办理第一业务时,用户通过终端发送办理第一业务所需的语音数据以及文本数据至计算机设备,则目标识别引擎为可以对该语音数据以及文本数据进行识别的识别引擎。

可选的,第一业务属性信息可以包括第一业务的业务等级或者第一业务的业务收益中的至少一种。则可以根据第一业务属性信息确定与第一业务属性信息对应的识别引擎。第一业务的业务等级是指处理第一业务需要获取的识别数据的等级,识别数据可以包括语音数据、指纹数据、面部数据中的至少一种。例如,面部数据的识别等级大于指纹数据的识别等级,指纹数据的识别等级大于语音数据的识别等级,等等。识别数据的识别等级越低表示识别复杂程度越低,识别数据的识别等级越高表示识别复杂程度越高。也就是说,若第一业务属性信息只包括语音数据,则第一业务的业务等级较低;若第一业务属性信息包括面部数据,则第一业务的业务等级较高。第一业务的业务等级较低时,可以使用成本较低的识别引擎即可实现对多媒体数据的识别,且识别结果满足业务处理的识别需求。第一业务的业务等级较高时,可以使用识别准确度较高的识别引擎进行识别,提高识别精度。当第一业务的业务等级较高时,使用识别精度较高的识别引擎,可以提高识别的准确度;当第一业务的业务等级较低时,使用识别成本较低的识别引擎,可以节省业务处理的成本。

第一业务的业务收益可以为对第一业务的预期收益,例如,识别引擎对应的成本越低,则第一业务的业务收益越高;识别引擎对应的成本越低高,则第一业务的业务收益越低。

s104,输出关于处理第一业务的提示信息。

这里,第一业务的提示信息是指处理第一业务的流程信息。例如,处理第一业务的流程信息包括获取用户身份信息、获取用户面部数据,则第一业务的提示信息可以包括“请填写当前显示的身份信息”、“请将面部对准摄像头”、“请眨眨眼”、“请左右移动面部”等等。通过输出关于处理第一业务的提示信息,用户可以根据该提示信息进行相应的回复,例如填写身份信息、面部对准摄像头等,以使终端采集用户根据第一业务的提示信息进行回复,得到第二多媒体数据。这里,第二多媒体数据可以包括语音数据类型、视频数据类型,等等。若第二多媒体数据为语音数据类型,则终端对用户根据第一业务的提示信息所回复的语音进行录音,得到语音数据,即第二多媒体数据;若第二多媒体数据为视频数据类型,则终端对用户根据第一业务的提示信息所回复的视频进行录制,得到视频数据,即第二多媒体数据。

s105,从终端中获取针对提示信息所发送的第二多媒体数据。

这里,由于上述步骤中终端采集用户根据第一业务的提示信息所回复的第二多媒体数据,因此,终端可以将第二多媒体数据发送至计算机设备,则计算机设备获取到针对提示信息所发送的第二多媒体数据。

s106,将第二多媒体数据发送至第一业务平台,以使第一业务平台采用目标识别引擎对第二多媒体数据进行识别,处理第一业务。

这里,第一业务平台可以是指处理第一业务的平台。例如,第一业务为办理信用卡,则第一业务平台为银行平台。计算机设备将第二多媒体数据发送至第一业务平台后,第一业务平台采用目标识别引擎对第二多媒体数据进行识别,处理第一业务。

具体的,第一业务平台可以采用目标识别引擎对第二多媒体数据进行识别,识别第二多媒体数据的真实性,若第二多媒体数据具有真实性,处理第一业务;若第二多媒体数据不具有真实性,则结束处理第一业务。例如,第二多媒体数据中包括用户的面部信息,则采用目标识别引擎对第二多媒体数据进行识别,识别第二多媒体数据的真实性可以包括:识别第二多媒体数据中包括的用户的面部信息是否为第一业务平台存储的该用户的面部信息,若是,则认为第二多媒体数据具有真实性;若否,则认为第二多媒体数据不具有真实性。其中,第一业务平台存储的用户的面部信息可以根据该用户在该第一业务平台办理的历史业务时存储的面部信息。例如,用户曾在该第一业务平台办理了银行卡,则第一业务平台存储的用户的面部信息可以为用户曾在该第一业务平台办理该银行卡时预留的用户面部信息。若用户在该第一业务平台未办理历史业务,或者用户在第一业务平台办理历史业务时未存储面部信息,则可以从其他存储有用户面部信息的平台中获取用户的面部信息,例如可以从公安部、民政部等机构对应的平台中获取用户的面部信息。

可选的,在处理第一业务后,还可以获取终端发送的多媒体数据,通过对该多媒体数据进行识别确定第二业务属性信息,并从共享识别引擎集合中确定与第二业务属性信息匹配的识别引擎,作为第二识别引擎,输出关于处理第二业务的提示信息;从终端中获取针对第二业务的提示信息所发送的多媒体数据,并将该多媒体数据发送至第二业务平台,以处理第二业务。也就是说,由于共享识别引擎集合包括至少一个识别引擎,且不同的识别引擎与不同的业务对应,因此,该种方式可以将多个识别引擎集中在一个集合中,实现不同业务均共享一个识别引擎,不需要为不同业务定制识别引擎,节省成本。该种方式也将多种业务集中在一起,便于快速对接到业务平台,即使用户需要办理多种不同业务,通过识别多媒体数据中的业务属性信息,即可对接到对应的识别引擎,处理对应的业务,从而提高业务处理效率。

可选的,本申请中的计算机设备可以是指区块链中的任一节点设备,所谓区块链是一种分布式数据存储、点对点传输(p2p传输)、共识机制、加密算法等计算机技术的新型应用模式,其本质上是一个去中心化的数据库;区块链可由多个借由密码学串接并保护内容的串连交易记录(又称区块)构成,用区块链所串接的分布式账本能让多方有效纪录交易,且可永久查验此交易(不可篡改)。其中,共识机制是指区块链网络中实现不同节点之间建立信任、获取权益的数学算法;也就是说,共识机制是区块链各网络节点共同认可的一种数学算法。本申请可利用区块链的共识机制,来实现多种业务共用共享识别引擎集合中的识别引擎,避免资源浪费,节省成本。

本申请实施例中,通过对第一多媒体数据进行识别,可以获取到与第一业务对应的第一业务属性信息。通过确定第一业务对应的目标识别引擎,在后续处理第一业务时,使用该目标识别引擎进行识别,处理第一业务。由于共享识别引擎集合中包括多个识别引擎,即该种方式可以将多个识别引擎集中在共享识别引擎集合中,不同业务均可共享该集合中的识别引擎,不需要为不同业务定制识别引擎,可以避免资源浪费,节省硬件资源的投入,从而节省成本。进一步的,输出关于处理第一业务的提示信息,从终端中获取针对提示信息所发送的第二多媒体数据,通过输出提示信息,终端可以采集用户根据该提示信息进行回复得到的第二多媒体数据。将第二多媒体数据发送至第一业务平台,以使第一业务平台采用目标识别引擎对第二多媒体数据进行识别,处理第一业务。在用户需要进行业务办理时,只需要通过获取多媒体数据中的业务属性信息,确定对应的业务以及业务对应的识别引擎,将第一业务对应的多媒体数据发送至第一业务平台,第一业务平台即可采用对应的识别引擎进行识别,处理第一业务。可以实现将确定识别引擎和处理业务两种流程进行分离,实现快速对接到业务处理平台进行业务处理。

在一个实施例中,该第一业务属性信息包括第一业务的标识,上述步骤s104中可包括如下步骤s11~s13。

s11,根据第一业务的标识确定处理第一业务平台。

s12,从第一业务平台中获取关于处理第一业务的提示信息。

s13,输出第一提示信息。

在步骤s11~s13中,第一业务的标识用于唯一的指示该第一业务,例如第一业务的标识可以为第一业务的名称、第一业务的名称简写、第一业务的名称的拼音、第一业务的名称的拼音的缩写、以及用于指示第一业务的编号,等等。则处理第一业务平台为可以对第一业务进行处理的平台,例如第一业务标识为平安银行卡办理,则第一业务平台为平安银行平台。计算机设备通过确定第一业务平台,可以从第一业务平台中获取办理第一业务的流程信息,例如上述步骤中的获取用户身份信息、获取用户面部数据,等等,得到第一业务的提示信息,输出第一提示信息至终端。用户可以通过终端查看到该提示信息,并根据提示信息进行对应的回复,以进行业务办理。

在一个实施例中,该第一多媒体数据包括第一语音数据,上述步骤s102中可包括如下步骤s21~s23。

s21,对第一语音数据进行语音识别,得到第一语音数据中与业务相关联的第一关键词,根据第一关键词确定第一业务属性信息。

这里,第一语音数据是指通过对用户说话的声音进行采集得到的数据。与业务相关联的第一关键词例如可以为业务的名称、业务的名称缩写、以及用于表示业务的编号等等。计算机设备通过对第一语音数据进行语音识别,得到第一语音数据中与业务相关联的第一关键词,例如业务的名称,则根据业务的名称确定第一业务属性信息。例如第一语音数据为“我要办理银行卡”,第一关键词为“银行卡”,可以通过获取第一关键词的前后词语确定第一业务属性信息,例如确定出第一业务属性信息包括“办理银行卡”。

具体实现中,计算机设备可以采用asr技术或者其他语音识别技术对语音数据进行识别,得到第一语音数据中与业务相关联的第一关键词,根据第一关键词确定第一业务属性信息。

s22,对第一语音数据进行转换,得到第一语音数据对应的第一文本数据。

这里,由于第一语音数据为语音类型的数据,可以将语音类型的数据转换为文本类型的数据,得到第一文本数据。

s23,对第一文本数据进行关键词提取,得到第一文本数据中与业务相关联的第二关键词,根据第二关键词确定第一业务属性信息。

这里,第一关键词和第二关键词可以相同,第一关键词与第二关键词也可以不同。计算机设备将第一语音数据转换为第一文本数据后,对第一文本数据进行关键词提取,得到第一文本数据中与业务相关联的第二关键词,根据第二关键词确定第一业务属性信息。

具体实现中,计算机设备首先对第一文本数据进行分词处理,将第一文本数据划分为至少一个分词;获取停用词集合,停用词集合中包括至少一个与业务无关的词语;在停用词集合中查找与该至少一个分词相匹配的目标词语;删除该至少一个分词中的目标词语;对删除该目标词语后的至少一个分词进行关键词提取,得到第二关键词,根据第二关键词确定第一业务属性信息。

例如,第一文本数据为“我想办理银行卡”,分词处理的结果即为“我想办理银行卡”,从而分成了4个分词,然后将这4个分词分别与停用词集合中的各个停用词进行匹配,若匹配到“我”、“想”这2个分词,则删除这2个分词,从而得到“办理银行卡”,对“办理银行卡”进行关键词提取,得到第二关键词“银行卡”,则根据第二关键词确定第一业务属性信息。

具体实现中,可以根据具体需求选择对第一语音数据进行语音识别,或者将第一语音数据转换为文本数据进行关键词提取,例如,语音识别的成本较低,则在节省成本的情况下,采用语音识别;或者,语音数据转换为文本数据进行关键词提取的准确度较高,则在提高识别准确度的情况下,采用语音数据转换为文本数据进行关键词提取。

通过对第一语音数据进行语音识别,或者将第一语音数据转换为文本数据进行转换,并对文本数据进行关键词提取,可以得到第一业务属性信息,从而可以根据第一业务属性信息确定生物识别引擎以及第一业务平台,进而可以进行相应的业务处理。

在一个实施例中,该第一业务属性信息包括第一业务的业务等级,上述步骤s103中可包括如下步骤s31~s32。

s31,获取共享识别引擎集合中的识别引擎的识别等级,识别引擎的识别等级用于反映识别引擎识别多媒体数据的准确度。

s32,将共享识别引擎集合中识别等级与第一业务的业务等级匹配的识别引擎,确定为目标识别引擎。

在步骤s31~s32中,识别引擎的识别等级越高,识别引擎识别多媒体数据的准确度越高;识别引擎的识别等级越低,识别引擎识别多媒体数据的准确度越低。第一业务的业务等级越高,则表示处理第一业务需要获取的识别数据的识别等级越高;第一业务的业务等级越低,则表示处理第一业务需要获取的识别数据的识别等级越低。例如,处理第一业务需要获取的识别数据为语音数据,表示第一业务的业务等级较低,则与第一业务的业务等级匹配度识别引擎的识别等级较低;处理第一业务需要获取的识别数据为面部数据,表示第一业务的业务等级较高,则与第一业务的业务等级匹配度识别引擎的识别等级较高。

可选的,在处理第一业务需要获取的识别数据为语音数据、指纹数据以及面部数据中的至少两种的情况下,可以根据识别数据的类型确定第一业务的业务等级。例如,处理第一业务需要获取的识别数据包括语音数据、指纹数据以及面部数据时,则第一业务的业务等级较高;处理第一业务需要获取的识别数据包括语音数据和指纹数据时,则第一业务的业务等级较低。例如,处理第一业务1-第一业务4需要获取的识别数据分别包括识别数据1-识别数据4,且识别数据1包括语音数据和指纹数据、识别数据2包括语音数据和面部数据、识别数据3包括指纹数据和面部数据、识别数据4包括语音数据、指纹数据以及面部数据,则第一业务1的业务等级小于第一业务2的业务等级,第一业务2的业务等级小于第一业务3的业务等级,第一业务3的业务等级小于第一业务4的业务等级。

通过获取共享识别引擎集合中的识别引擎的识别等级,将共享识别引擎集合中识别等级与第一业务的业务等级匹配的识别引擎,确定为目标识别引擎。在第一业务的业务等级较低的情况下,可以采用识别等级较低的识别引擎,从而可以节省成本;在第一业务的业务等级较高的情况下,可以采用识别等级较高的识别引擎,从而可以提高识别多媒体数据的准确度。

在一个实施例中,该第一业务属性信息包括第一业务的业务收益,上述步骤s103中可包括如下步骤s41~s42。

s41,获取共享识别引擎集合中的识别引擎的识别成本。

s42,将共享识别引擎集合中识别成本与第一业务的业务收益匹配的识别引擎,确定为目标识别引擎。

在步骤s41~s42中,第一业务的业务收益可以为对第一业务的预期收益,识别引擎的识别成本是指购买或者使用该识别引擎所需支出的货币的数量,识别引擎的识别成本越低,则第一业务的业务收益越高;识别引擎的识别成本越高,则第一业务的业务收益越低。计算机设备通过获取共享识别引擎集合中的识别引擎的识别成本,将共享识别引擎集合中识别成本与第一业务的业务收益匹配的识别引擎,确定为目标识别引擎。在第一业务的业务收益较高的情况下,采用识别成本较低的识别引擎识别多媒体数据,可以实现降低识别成本,从而提高第一业务的业务收益。

可选的,请参见图2,图2是本申请实施例提供的一种数据处理方法的流程示意图。该方法应用于计算机设备;如图2所示,该方法包括:

s201,从终端中获取关于第一业务的第一多媒体数据。

s202,对第一多媒体数据进行识别,得到第一业务属性信息。

s203,从共享识别引擎集合中确定与第一业务属性信息匹配的识别引擎,作为目标识别引擎。

s204,输出关于处理第一业务的提示信息。

s205,从终端中获取针对提示信息所发送的第二多媒体数据。

这里,第二多媒体数据包括第一视频数据和第二语音数据,步骤s201~s205的具体实现方式可参考图1对应的实施例中步骤s101~s105的描述,此处不再赘述。

s206,根据第一视频数据获取终端对应的用户的第一图像。

这里,第一视频数据为终端采集的用户根据处理第一业务的提示信息进行回复得到的视频数据。第一视频数据中包括用户的面部图像。

计算机设备可以每隔预设时间对第一视频数据进行截取,得到包含用户面部的第一图像,得到终端对应的用户的第一图像。例如,可以每隔0.5秒钟截取第一视频数据中的图像,得到第一图像。例如第一视频数据的时长为2秒,则获取到用户的第一图像的数量为4张。

s207,将第一图像、第一视频数据以及第二语音数据发送至第一业务平台,以使第一业务平台根据第一图像验证终端的合法性,在终端具有合法性时,采用目标识别引擎对第一视频数据以及第二语音数据进行识别,处理第一业务。

这里,第二语音数据为终端采集的用户根据处理第一业务的提示信息进行回复的语音数据。计算机设备将第一图像、第一视频数据以及第二语音数据发送至第一业务平台以使第一业务平台根据第一图像验证终端的合法性,在终端具有合法性时,采用目标识别引擎对第一视频数据以及第二语音数据进行识别,处理第一业务。

具体实现中,第一业务平台获取到第一图像、第一视频数据以及第二语音数据后,可以采用目标识别引擎对第一图像进行识别,确定第一图像中用户的面部图像与第一业务平台存储的用户图像是否为同一用户的面部图像,若是,则确定终端具有合法性,则采用目标识别引擎对第一视频数据以及第二语音数据进行识别,处理第一业务。若否,则确定终端不具有合法性,则生成用于指示终端不具有合法性的警示信息,以使用户根据该警示信息进行姿态调整。

在一种可能的实现方式中,第一业务平台采用目标识别引擎对第一视频数据以及第二语音数据进行识别时,可以获取第一视频数据中与第二语音数据对应的用户的第三图像,即从第一视频数据中获取用户根据第一业务的提示信息回答问题时的第三图像,该第三图像中包含用户的面部图像。通过对第三图像进行微表情识别,从而根据用户回答问题时的微表情确定用户回答的问题的真实性。若通过微表情识别确定用户回答的问题真实性较高,则处理第一业务。若通过微表情识别确定用户回答的问题真实性较低,则发送用于二次验证用户身份的指示信息或再次输出用户微表情异常的问题。若二次验证通过或用户再次回答该问题时的表情指示用户回答的问题真实性较高,则处理第一业务。若二次验证未通过或用户再次回答该问题时的表情指示用户回答的问题真实性较低,则输出用于指示用户在第一业务平台对应的人工业务办理处进行业务办理,并结束处理第一业务。

通过获取第一视频数据中的第一图像,并发送第一图像至第一业务平台进行验证,可以提高用户身份的真实性,以及第一业务平台通过对第一视频数据中的第三图像进行微表情识别,可以识别用户回答的问题的真实性,从而实现二次验证用户的身份信息,提高业务办理的准确性。

在一个实施例中,上述步骤方法可包括如下步骤s51~s54。

s51,若获取到第一业务平台发送的用于指示终端不具有合法性的警示信息,则输出用于指示用户进行姿态调整的调整信息。

s52,获取终端针对调整信息发送的第三多媒体数据,第三多媒体数据包括第三视频数据。

s53,根据第三视频数据获取用户的第二图像。

s54,将第二图像发送至第一业务平台,以使第一业务平台根据第二图像验证终端的合法性。

在步骤s51~s54中,若计算机设备获取到第一业务平台发送的用于指示终端不具有合法性的警示信息,则输出用于指示用户进行姿态调整的调整信息,以使用户根据该调整信息进行姿态调整,例如,用户的面部未对准终端的摄像头时,则调整后的用户面部对准终端的摄像头;或者,终端的摄像头中包括用户a和用户b的情况下,且用户a为需要办理第一业务的用户,则调整后的终端的摄像头中只包括用户a。

计算机设备获取终端针对调整信息发送的第三多媒体数据,第三多媒体数据包括第三视频数据;根据第三视频数据获取用户的第二图像;将第二图像发送至第一业务平台,以使第一业务平台根据第二图像验证终端的合法性。第二图像中包括用户的面部图像,若第二图像与第一业务平台中存储的用户面部图像为同一用户的面部图像,则终端具有合法性,处理第一业务。若第二图像与第一业务平台中存储的用户面部图像不为同一用户的面部图像,则终端不具有合法性,则结束处理第一业务,输出用于指示用户在第一业务平台对应的人工业务办理处进行业务办理,并结束处理第一业务。通过在验证第一终端不具有合法性的情况下,通过输出调整信息提示用户进行姿态调整,可以实现对终端合法性的验证,从而提高用户身份信息验证的真实性。

上面介绍了本申请实施例的方法,下面介绍本申请实施例的装置。

参见图3,图3是本申请实施例提供的一种数据处理装置的组成结构示意图,上述数据处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如该数据处理装置为一个应用软件;该装置可以用于执行本申请实施例提供的方法中的相应步骤。该装置30包括:

第一获取模块301,用于从终端中获取关于第一业务的第一多媒体数据;

数据识别模块302,用于对该第一多媒体数据进行识别,得到该第一业务属性信息,该第一业务属性信息包括该第一业务的业务等级或者该第一业务的业务收益中的至少一种;

引擎确定模块303,用于从共享识别引擎集合中确定与该第一业务属性信息匹配的识别引擎,作为目标识别引擎;

信息输出模块304,用于输出关于处理该第一业务的提示信息;

第二获取模块305,用于从该终端中获取针对该提示信息所发送的第二多媒体数据;

业务处理模块306,用于将该第二多媒体数据发送至第一业务平台,以使该第一业务平台采用该目标识别引擎对该第二多媒体数据进行识别,处理该第一业务。

可选的,该信息输出模块304,用于:

根据该第一业务的标识确定处理该第一业务平台;

从该第一业务平台中获取关于处理该第一业务的提示信息;

输出该第一提示信息。

可选的,该第一多媒体数据包括第一语音数据,该数据识别模块302,具体用于:

对该第一语音数据进行语音识别,得到该第一语音数据中与业务相关联的第一关键词,根据该第一关键词确定该第一业务属性信息;

或者,对该第一语音数据进行转换,得到该第一语音数据对应的第一文本数据;

对该第一文本数据进行关键词提取,得到该第一文本数据中与业务相关联的第二关键词;根据该第二关键词确定该第一业务属性信息。

可选的,该第一业务属性信息包括该第一业务的业务等级;该引擎确定模块303,具体用于:

获取该共享识别引擎集合中的识别引擎的识别等级,该识别引擎的识别等级用于反映该识别引擎识别多媒体数据的准确度;

将该共享识别引擎集合中识别等级与该第一业务的业务等级匹配的识别引擎,确定为该目标识别引擎。

可选的,该第一业务属性信息包括该第一业务的业务收益;该引擎确定模块303,具体用于:

获取该共享识别引擎集合中的识别引擎的识别成本;

将该共享识别引擎集合中识别成本与该第一业务的业务收益匹配的识别引擎,确定为该目标识别引擎。

可选的,该第二多媒体数据包括第一视频数据和第二语音数据;该业务处理模块306,具体用于:

根据该第一视频数据获取该终端对应的用户的第一图像;

将该第一图像、该第一视频数据以及该第二语音数据发送至该第一业务平台,以使该第一业务平台根据该第一图像验证该终端的合法性,在该终端具有合法性时,采用该目标识别引擎对该第一视频数据以及第二语音数据进行识别,处理该第一业务。

可选的,该装置还包括:调整模块307,用于:

若获取到该第一业务平台发送的用于指示该终端不具有合法性的警示信息,则输出用于指示该用户进行姿态调整的调整信息;

获取该终端针对该调整信息发送的第三多媒体数据,该第三多媒体数据包括第三视频数据;

根据该第三视频数据获取该用户的第二图像;

将该第二图像发送至该第一业务平台,以使该第一业务平台根据该第二图像验证该终端的合法性。

需要说明的是,图3对应的实施例中未提及的内容可参见方法实施例的描述,这里不再赘述。

本申请实施例中,通过对第一多媒体数据进行识别,可以获取到与第一业务对应的第一业务属性信息。通过确定第一业务对应的目标识别引擎,在后续处理第一业务时,使用该目标识别引擎进行识别,处理第一业务。由于共享识别引擎集合中包括多个识别引擎,即该种方式可以将多个识别引擎集中在共享识别引擎集合中,不同业务均可共享该集合中的识别引擎,不需要为不同业务定制识别引擎,可以避免资源浪费,节省硬件资源的投入,从而节省成本。进一步的,输出关于处理第一业务的提示信息,从终端中获取针对提示信息所发送的第二多媒体数据,通过输出提示信息,终端可以采集用户根据该提示信息进行回复得到的第二多媒体数据。将第二多媒体数据发送至第一业务平台,以使第一业务平台采用目标识别引擎对第二多媒体数据进行识别,处理第一业务。在用户需要进行业务办理时,只需要通过获取多媒体数据中的业务属性信息,确定对应的业务以及业务对应的识别引擎,将第一业务对应的多媒体数据发送至第一业务平台,第一业务平台即可采用对应的识别引擎进行识别,处理第一业务。可以实现将确定识别引擎和处理业务两种流程进行分离,实现快速对接到业务处理平台进行业务处理。

参见图4,图4是本申请实施例提供的一种计算机设备的组成结构示意图。如图4所示,上述计算机设备40可以包括:处理器401,网络接口404和存储器405,此外,上述计算机设备40还可以包括:用户接口403,和至少一个通信总线402。其中,通信总线402用于实现这些组件之间的连接通信。其中,用户接口403可以包括显示屏(display)、键盘(keyboard),可选用户接口403还可以包括标准的有线接口、无线接口。网络接口404可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器405可以是高速ram存储器,也可以是非易失性的存储器(non-volatilememory),例如至少一个磁盘存储器。存储器405可选的还可以是至少一个位于远离前述处理器401的存储装置。如图4所示,作为一种计算机可读存储介质的存储器405中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。

在图4所示的计算机设备40中,网络接口404可提供网络通讯功能;而用户接口403主要用于为用户提供输入的接口;而处理器401可以用于调用存储器405中存储的设备控制应用程序,以实现:

从终端中获取关于第一业务的第一多媒体数据;

对该第一多媒体数据进行识别,得到该第一业务属性信息,该第一业务属性信息包括该第一业务的业务等级或者该第一业务的业务收益中的至少一种;

从共享识别引擎集合中确定与该第一业务属性信息匹配的识别引擎,作为目标识别引擎;

输出关于处理该第一业务的提示信息;

从该终端中获取针对该提示信息所发送的第二多媒体数据;

将该第二多媒体数据发送至第一业务平台,以使该第一业务平台采用该目标识别引擎对该第二多媒体数据进行识别,处理该第一业务。

应当理解,本申请实施例中所描述的计算机设备40可执行前文图1、图2所对应实施例中对上述数据处理方法的描述,也可执行前文图3所对应实施例中对上述数据处理装置的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。

本申请实施例中,通过对第一多媒体数据进行识别,可以获取到与第一业务对应的第一业务属性信息。通过确定第一业务对应的目标识别引擎,在后续处理第一业务时,使用该目标识别引擎进行识别,处理第一业务。由于共享识别引擎集合中包括多个识别引擎,即该种方式可以将多个识别引擎集中在共享识别引擎集合中,不同业务均可共享该集合中的识别引擎,不需要为不同业务定制识别引擎,可以避免资源浪费,节省硬件资源的投入,从而节省成本。进一步的,输出关于处理第一业务的提示信息,从终端中获取针对提示信息所发送的第二多媒体数据,通过输出提示信息,终端可以采集用户根据该提示信息进行回复得到的第二多媒体数据。将第二多媒体数据发送至第一业务平台,以使第一业务平台采用目标识别引擎对第二多媒体数据进行识别,处理第一业务。在用户需要进行业务办理时,只需要通过获取多媒体数据中的业务属性信息,确定对应的业务以及业务对应的识别引擎,将第一业务对应的多媒体数据发送至第一业务平台,第一业务平台即可采用对应的识别引擎进行识别,处理第一业务。可以实现将确定识别引擎和处理业务两种流程进行分离,实现快速对接到业务处理平台进行业务处理。

本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令当被计算机执行时使该计算机执行如前述实施例该的方法,该计算机可以为上述提到的计算机设备的一部分。例如为上述的处理器401。作为示例,程序指令可被部署在一个计算机设备上执行,或者被部署位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链网络。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,该的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。

以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

相关标签: 数据处理语音芯片
tips