实时通话的信息提取方法、装置、处理器和电子设备与流程
本申请涉及语音识别领域,具体而言,涉及一种实时通话的信息提取方法、装置、计算机可读存储介质、处理器和电子设备。
背景技术:
现有呼叫中心,坐席在接听客户电话后,需依据通话内容整理通话信息:包括来电客户的号码、客户姓名、年龄、性别、请求通话原因等信息,形成通话小结。对于坐席人员来说该工作较为繁琐,且降低工作效率,人为记录也可能存在遗漏或错记的情况。
在背景技术部分中公开的以上信息只是用来加强对本文所描述技术的背景技术的理解,因此,背景技术中可能包含某些信息,这些信息对于本领域技术人员来说并未形成在本国已知的现有技术。
技术实现要素:
本申请的主要目的在于提供一种实时通话的信息提取方法、装置、计算机可读存储介质、处理器和电子设备,以解决现有技术中的需要人工记录一些关键内容导致效率较低的问题。
根据本发明实施例的一个方面,提供了一种实时通话的信息提取方法,包括:抓取语音通话过程中的语音数据包;至少根据所述语音数据包确定对应的通话信息,所述通话信息至少包括客户信息、通话摘要以及请求通话原因,所述客户信息至少包括客户姓名。
可选地,至少根据所述语音数据包确定对应的通话信息,包括:将所述语音数据包转换为文本信息;采用文本分析技术对所述文本信息进行分析,得到所述客户信息、所述通话摘要和所述请求通话原因。
可选地,所述语音通话过程为响应客户来电的通话过程,所述方法还包括:获取所述语音通话过程的通话随路信息;至少根据所述语音数据包确定对应的通话信息,还包括:根据所述通话随路信息确定来电号码、来电归属地以及通话时长。
可选地,至少根据所述语音数据包确定对应的通话信息,还包括:将所述客户信息、所述通话摘要、所述请求通话原因、所述来电号码、所述来电归属地以及所述通话时长整合生成所述通话信息。
可选地,在至少根据所述语音数据包确定对应的通话信息之后,所述方法还包括:将所述通话信息展示在显示界面上。
可选地,所述客户信息还包括以下至少之一:客户性别、客户年龄、客户住址。
根据本发明实施例的另一方面,还提供了一种实时通话的信息提取装置,包括抓取单元和确定单元,其中,所述抓取单元用于抓取语音通话过程中的语音数据包;所述确定单元用于至少根据所述语音数据包确定对应的通话信息,所述通话信息至少包括客户信息、通话摘要以及请求通话原因,所述客户信息至少包括客户姓名。
根据本发明实施例的又一方面,提供了一种计算机可读存储介质,所述存储介质包括存储的程序,其中,所述程序执行上述任一种所述的方法。
根据本发明实施例的再一方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任一种所述的方法。
根据本发明实施例的另一方面,还提供了一种电子设备,包括一个或多个处理器,存储器以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行上述任一种所述的方法。
本申请提供了一种实时通话的信息提取方法,通过抓取所述语音通话过程中的语音数据包,确定所述语音数据包对应的所述客户信息、通话摘要、通话信息和请求通话原因等通话信息,实现了自动提取通话中的客户信息,减少了客服人员的工作量,提高了工作效率,方便回溯,同时自动提取通话信息避免了人为记录导致的信息遗漏或错记问题,准确性高。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了根据本申请实施例的实时通话的信息提取方法生成的流程示意图;
图2示出了根据本申请实施例的实时通话的信息提取装置的组成示意图。
其中,上述附图包括以下附图标记:
10、抓取单元;20、确定单元。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应该理解的是,当元件(诸如层、膜、区域、或衬底)描述为在另一元件“上”时,该元件可直接在该另一元件上,或者也可存在中间元件。而且,在说明书以及权利要求书中,当描述有元件“连接”至另一元件时,该元件可“直接连接”至该另一元件,或者通过第三元件“连接”至该另一元件。
为了便于描述,以下对本申请实施例涉及的部分名词或术语进行说明:
自动语音识别技术(asr,automaticspeechrecognition):是一种将人的语音转换为文本的技术;
命名实体识别功能(ner,namedenityrecognition):提供对于通话文本中的相关实体进行提取的功能,并标注出其类型。提取实体的类别包括人名、地址和机构名;
用户特征提取功能(aufe,automaticuserfeatureextraction):提供对于通话文本中的用户的相关信息进行提取的功能,并标注出其类型。提取实体的类别包括年龄、性别、身份证号;
文本自动摘要功能:主要用于对一通通话内容或一片文本提取其摘要句,一般为1-5句,最多返回5句,根据文本内容自动确定返回摘要句内容。该方法可用于迅速提取文本或语音的核心内容,方便用户快速了解通话主题或文本主题;
通话主题分类:主要应用于将已知通话内容而未知通话类别的通话自动划分到预设好的通话类别中,从而极大的节省人工标注通话类别的工作量。例如在客服系统中,每当完成一次客服通话,往往希望知道该通话的大致通话内容,如是客户投诉,还是某项具体业务等,大量的客服数据难以人工完成分类,使用自动分类模块可以快速的满足该需求;
抓包工具:就是将网络传输发送与接收的数据包进行截获、重发、编辑、转存等操作。
正如背景技术中所说的,现有技术中需要人工记录一些关键内容导致效率较低,为了解决上述问题,本申请的一种典型的实施方式中,提供了一种实时通话的信息提取方法、装置、计算机可读存储介质、处理器和电子设备。
根据本申请的实施例,提供了一种实时通话的信息提取方法。
图1是根据本申请实施例的实时通话的信息提取方法的流程图。如图1所示,该方法包括以下步骤:
步骤s101,抓取语音通话过程中的语音数据包;
步骤s102,至少根据上述语音数据包确定对应的通话信息,上述通话信息至少包括客户信息、通话摘要以及请求通话原因,上述客户信息至少包括客户姓名。
上述实时通话的信息提取方法,通过抓取上述语音通话过程中的语音数据包,确定上述语音数据包对应的上述客户信息、通话摘要、通话信息和请求通话原因等通话信息,实现了自动提取通话中的相关信息,减少了客服人员的工作量,提高了工作效率,方便回溯,同时自动提取通话信息避免了人为记录导致的信息遗漏或错记问题,准确性高。
本申请的一种典型的实施例中,至少根据上述语音数据包确定对应的通话信息,包括:将上述语音数据包转换为文本信息;采用文本分析技术对上述文本信息进行分析,得到上述客户信息、上述通话摘要和上述请求通话原因。上述方法通过将上述语音数据包转换为文本信息,并采用上述文本分析技术对上述文本信息进行分析,得到上述客户信息、上述通话摘要和上述请求通话原因等通话信息内容,实现了自动提取通信信息并自动生成通话小结的目的,进一步减少了客户人员工作量,提高了工作效率。
本申请的一种实施例中,上述语音通话过程为响应客户来电的通话过程,上述方法还包括:获取上述语音通话过程的通话随路信息;至少根据上述语音数据包确定对应的通话信息,还包括:根据上述通话随路信息确定来电号码、来电归属地以及通话时长。通过获取上述通话随路信息并根据上述通话随路信息来确定上述来电号码、上述来电归属地以及上述通话时长等上述通话信息,进一步地减轻了客服工作量,提升了工作效率,且获取的上述通话信息内容全面,可以让客服人员清楚的知道通话内容,进一步地简化了客服的工作内容。
本申请的另一种具体的实施例中,至少根据上述语音数据包确定对应的通话信息,还包括:将上述客户信息、上述通话摘要、上述请求通话原因、上述来电号码、上述来电归属地以及上述通话时长整合生成上述通话信息。这样使得确定的上述通话信息更加完整,让人能很直观地了解通话的大致内容,进一步地方便了客服人员的工作。
根据本申请的又一种具体的实施例,在至少根据上述语音数据包确定对应的通话信息之后,上述方法还包括:将上述通话信息展示在显示界面上。通过将上述通话信息展示在显示界面上,使得客服人员方便回溯,同时展示在上述显示界面上的上述通话信息也可作为客户画像标签供客服人员进行分析,可以进一步地提升工作效率,进而减轻客服人员的工作量,减少人工成本。
为了进一步的保证提取的上述通话信息的完整性和可追溯性,根据本申请的再一种具体的实施例,上述客户信息还包括以下至少之一:客户性别、客户年龄、客户住址。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种实时通话的信息提取装置,需要说明的是,本申请实施例的实时通话的信息提取装置可以用于执行本申请实施例所提供的实时通话的信息提取方法。以下对本申请实施例提供的实时通话的信息提取装置进行介绍。
图2是根据本申请实施例的实时通话的信息提取装置的示意图。如图2所示,该装置包括抓取单元10和确定单元20,其中,上述抓取单元10用于通过抓包工具抓取语音通话过程中的语音数据包;上述确定单元20用于至少根据上述语音数据包确定对应的通话信息,上述通话信息至少包括客户信息、通话摘要以及请求通话原因,上述客户信息至少包括客户姓名。
上述实时通话的信息提取装置,上述抓取单元通过上述抓包工具抓取上述语音数据包,再由上述确定单元根据上述语音数据包确定对应的通话信息,通过自动提取并生成相关通话信息,可以辅助客服中心的客服人员完成每通来电的通话小结记录,可以让客服人员直观得了解通话的大致内容,减少了客服人员的工作量,提高了工作效率,从而进一步地降低了人工成本,同时生成的通话信息方便回溯,为后续工作提供了便利。
根据本申请的一种具体的实施例,上述确定单元包括语音实时转写模块和实时分析模块,其中,上述语音实时转写模块用于将上述语音数据包转换为文本信息;上述实时分析模块用于采用文本分析技术对上述文本信息进行分析,得到上述客户信息、上述通话摘要和上述请求通话原因。上述装置通过将上述语音数据包转换为文本信息,并采用上述文本分析技术对上述文本信息进行分析,得到上述客户信息、上述通话摘要和上述请求通话原因等通话信息内容,实现了自动提取通信信息并自动生成通话小结的目的,进一步减少了客户人员工作量,提高了工作效率。
本身请的一种具体的实施例中,上述语音实时转写模块包括语音数据接入子模块和语音实时转写子模块,其中,上述语音数据接入子模块用于接收上述语音数据包,上述语音实时转写子模块用于将上述语音数据接入子模块接收到的上述语音数据包转换为对应的文本信息;上述实时分析模块包括训练子模块和分析子模块,其中,上述训练子模块用于根据智能语音分析服务维护语料和预置的来电原因标签训练分析数据,上述分析子模块用于接收上述分析数据并通过文本分析技术建立分析模型,供上述训练子模块调用。具体地,上述抓取单元基于tcp长连接方式、采用自定义协议将上述语音数据包上报至上述语音实时转写模块的上述语音数据接入子模块,上述语音数据接入子模块将接收到的上述语音数据包传输给上述语音实时转写子模块,上述语音实时转写子模块通过自动语音识别技术将上述语音数据包转换为上述文本信息,并传入上述训练子模块,上述训练子模块通过调用上述分析子模块的分析数据,得到上述文本信息中的上述客户信息、通话摘要和请求通话原因。其中,上述自定义协议包括websocket协议和socket协议;上述文本分析技术包括命名实体识别功能、用户特征提取功能、文本自动摘要功能和通话主题分类功能。
根据本申请的另一种具体的实施例,上述语音通话过程为响应客户来电的通话过程,上述装置还包括获取单元,获取单元用于通过通话随路系统获取上述语音通话过程的通话随路信息;上述确定单元还用于根据上述通话随路信息确定来电号码、来电归属地以及通话时长。具体地,上述获取单元将上述通话随路信息传输至上述确定单元的上述语音实时转写模块,上述语音实时转写模块通过上述自动语音识别技术将上述通话随路信息转换为文本信息并传入上述实时分析模块,上述实时分析模块通过上述文本分析技术对上述文本信息进行分析,得到上述来电号码、来电归属地以及通话时长。通过获取上述通话随路信息并根据上述通话随路信息来确定上述来电号码、上述来电归属地以及上述通话时长等上述通话信息,进一步地减轻了客服工作量,提升了工作效率,且获取的上述通话信息内容全面,可以让客服人员清楚的知道通话内容,进一步地简化了客服的工作内容。
根据本申请的再一种具体的实施例,上述确定单元还包括整合模块,上述整合模块用于将上述客户信息、上述通话摘要、上述请求通话原因、上述来电号码、上述来电归属地以及上述通话时长整合生成上述通话信息。这样使得确定的上述通话信息更加完整,让人能很直观地了解通话的大致内容,进一步地方便了客服人员的工作。
根据本申请的又一种具体的实施例,上述确定单元还包括显示模块,上述显示模块用于将上述通话信息展示在显示界面上。通过将上述通话信息展示在显示界面上,使得客服人员方便回溯,同时展示在上述显示界面上的上述通话信息也可作为客户画像标签供客服人员进行分析,可以进一步地提升工作效率,进而减轻客服人员的工作量,减少人工成本。
为了进一步的保证提取的上述通话信息的完整性和可追溯性,根据本申请的一种实施例,上述客户信息还包括以下至少之一:客户性别、客户年龄、客户住址。
上述实时通话的信息提取装置包括处理器和存储器,上述抓取单元和确定单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决现有技术中的需要人工记录一些关键内容导致效率较低的问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现上述实时通话的信息提取方法。
本发明实施例提供了一种处理器,上述处理器用于运行程序,其中,上述程序运行时执行上述实时通话的信息提取方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现至少以下步骤:
步骤s101,抓取语音通话过程中的语音数据包;
步骤s102,至少根据上述语音数据包确定对应的通话信息,上述通话信息至少包括客户信息、通话摘要以及请求通话原因,上述客户信息至少包括客户姓名。
本文中的设备可以是服务器、pc、pad、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有至少如下方法步骤的程序:
步骤s101,抓取语音通话过程中的语音数据包;
步骤s102,至少根据上述语音数据包确定对应的通话信息,上述通话信息至少包括客户信息、通话摘要以及请求通话原因,上述客户信息至少包括客户姓名。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例上述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
为了使得本领域技术人员能够更加清楚地了解本申请的技术方案,以下将结合具体的实施例来说明。
实施例1
根据本申请的上述实时通话的信息提取方法,首先准备智能语音分析服务维护语料和预置的来电原因标签,训练上述分析数据并将上述分析数据传输给上述分析子模块建立分析模型。
客户来电,客服人员与客户进行通话,上述抓包工具抓取语音数据包;
上述抓取单元基于tcp长连接方式、采用websocket与socket中至少一种自定义协议,将上述语音数据包上报到上述确定单元;
上述确定单元中的上述语音实时转写模块的上述语音数据接入子模块接收到上述语音数据包,将上述语音数据包传输给上述语音实时转写子模块,上述语音实时转写子模块将上述语音数据包转写为文本信息,并传入上述实时分析模块,上述实时分析模块通过上述文本分析技术得到上述文本信息中的客户信息、通话摘要和请求通话原因;
上述语音实时转写模块从上述获取单元获取通话随路信息,经过上述确定单元得到上述通话随路信息中的来电号码、来电归属地、通话时长;
上述确定单元的整合模块将上述客户信息、上述通话摘要、上述请求通话原因、上述来电号码、上述来电归属地以及上述通话时长整合声称通话信息;
通话结束,上述整合通过消息推送服务将上述通话信息传给上述显示模块,上述显示模块将上述通话信息展示在显示界面上,可直接保存或者进行二次编辑。
上述实客户信息包括了客户性别、客户年龄、客户住址等。
从以上的描述中,可以看出,本申请上述的实施例实现了如下技术效果:
1)、本申请提供了一种实时通话的信息提取方法,通过抓取上述语音通话过程中的语音数据包,确定上述语音数据包对应的上述客户信息、通话摘要、通话信息和请求通话原因等通话信息,实现了自动提取通话中的客户信息,减少了客服人员的工作量,提高了工作效率,方便回溯,同时自动提取通话信息避免了人为记录导致的信息遗漏或错记问题,准确性高。
2)本申请还提供了一种实时通话的信息提取装置,上述抓取单元通过上述抓包工具抓取上述语音数据包,再由上述确定单元根据上述语音数据包确定对应的通话信息,通过自动提取并生成相关通话信息,可以辅助客服中心的客服人员完成每通来电的通话小结记录,可以让客服人员直观得了解通话的大致内容,减少了客服人员的工作量,提高了工作效率,从而进一步地降低了人工成本,同时生成的通话信息方便回溯,为后续工作提供了便利。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除