异常情况确定方法和正向匹配式生成方法与流程
2021-01-28 14:01:45|302|起点商标网
本申请涉及交通安全
技术领域:
,具体而言,涉及一种异常情况确定方法和正向匹配式生成方法。
背景技术:
:交通事故及事故发生后的求助一直是交通安全领域致力于解决的问题,交通事故具有发生频率高,发生后对人身和财产造成严重损失的特点,特别是在人身安全方面,轻则出现人伤,严重的可能会直接造成亡人现象。目前,通常对录音文件直接进行音频分析,检测录音文件对应的车辆是否发生车祸。或者,通过车载设备回传的数据来判断车辆是否出现急刹车或撞击等现象发生,进而确定是否有交通事故发生。但是上述方法均存在检测准确性低的问题。技术实现要素:有鉴于此,本申请提供了一种异常情况确定方法和生成正向匹配式的方法,以改善上述问题。本申请的实施例可以这样实现:第一方面,本申请实施例提供一种异常情况确定方法,所述方法包括:获取待检测服务对应的音频信息;获取所述音频信息对应的文本信息;根据正向匹配式与所述文本信息,确定所述文本信息与异常情况的相关程度信息,其中,所述正向匹配式与所述异常情况具有正向关系,所述相关程度信息表征所述文本信息与所述异常情况的相关程度值;当所述相关程度信息大于相关度阈值时,则确定所述待检测服务存在异常情况。在可选的实施方式中,所述正向匹配式包含至少一个正向字符串,每个所述正向字符串与所述异常情况具有正向关联;所述根据正向匹配式与所述文本信息,确定所述文本信息与异常情况的相关程度信息的步骤包括:将每一个所述正向字符串分别与所述文本信息进行匹配;当所述文本信息存在与所述正向字符串匹配成功的文本时,则将所述正向字符串作为目标字符串;获得全部所述目标字符串对应的正向得分;所述目标字符串对应的正向得分与所述异常情况为正相关;将全部所述目标字符串对应的正向得分作为所述相关程度信息。在可选的实施方式中,所述获得全部所述目标字符串对应的正向得分的步骤包括:获得每个所述目标字符串与对应的文本发生匹配的次数值,及每个所述目标字符串对应的正向字符串的权重信息;根据全部所述次数值和所述权重信息,获得全部所述目标字符串的加权和;将所述加权和作为所述正向得分。在可选的实施方式中,所述获取待检测服务对应的音频信息的步骤之前,所述方法还包括:获取至少一个历史行程对应的历史音频信息;将每个所述历史音频信息转化为历史文本信息;对所述历史文本信息进行文本拆分,得到多个历史字符串;获得每个所述历史字符串与发生异常情况的初始权重;从所述历史字符串中获取至少一个正向字符串,其中,所述正向字符串的初始权重大于或等于第一预设阈值;将全部所述正向字符串作为所述正向匹配式,根据全部所述正向字符串的初始权重,得到每个所述正向字符串的权重信息,其中所述初始权重与所述权重信息正相关。在可选的实施方式中,当所述正向匹配式包括至少一个正向字符串时,所述正向匹配式还包括各个正向字符串之间的逻辑关联信息。在可选的实施方式中,所述历史文本信息包括正向文本信息及负向文本信息,所述正向文本信息表征发生异常情况,所述负向文本信息表征未发生异常情况;所述获得每个所述历史字符串与发生异常情况的初始权重的步骤包括:基于第一频次与第二频次,获得每个所述历史字符串与发生异常情况的初始权重,其中,所述第一频次为每个所述历史字符串在所述正向文本信息中出现的次数值,所述第二频次为每个所述历史字符串在所述负向文本信息中出现的次数值。在可选的实施方式中,所述初始权重、所述第一频次及所述第二频次满足以下公式:其中,pmi(w,c=1)为第w个历史字符串与发生异常情况的初始权重,p(w|c=1)为第w个历史字符串对应的第一频次,p(w|c=0)为第w个历史字符串对应的第二频次。在可选的实施方式中,所述从所述历史字符串中获取至少一个所述正向字符串的步骤包括:从所述历史字符串中获取至少一个中间字符串,其中,所述中间字符串的初始权重大于或等于所述第一预设阈值;从全部所述中间字符串中获取至少一个所述正向字符串,其中,每个所述正向字符串所包括的每个字符与其他正向字符串所包括的每个字符均不相同。在可选的实施方式中,所述根据全部所述正向字符串的初始权重,得到每个所述正向字符串的权重信息,其中所述初始权重与所述权重信息正相关的步骤包括:获得每个所述正向字符串与发生异常情况的中间初始权重;将所述中间初始权重作为对应的权重信息。在可选的实施方式中,所述获取所述音频信息对应的文本信息的步骤之前,所述方法还包括:删除所述音频信息中的语音导航信息。第二方面,本申请实施例提供一种正向匹配式生成方法,所述方法包括:获取至少一个历史行程对应的历史音频信息;将每个所述历史音频信息转化为历史文本信息;对所述历史文本信息进行文本拆分,得到多个历史字符串;获得每个所述历史字符串与发生异常情况的初始权重;从所述历史字符串中获取至少一个所述正向字符串,其中,所述正向字符串的初始权重大于或等于第一预设阈值;将全部所述正向字符串作为所述正向匹配式,根据全部所述正向字符串的初始权重,得到每个所述正向字符串的权重信息,其中所述初始权重与所述权重信息正相关。在可选的实施方式中,当所述正向匹配式包括至少一个正向字符串时,所述正向匹配式还包括各个正向字符串之间的逻辑关联信息。在可选的实施方式中,所述历史文本信息包括正向文本信息及负向文本信息,所述正向文本信息表征发生异常情况,所述负向文本信息表征未发生异常情况;所述获得每个所述历史字符串与发生异常情况的初始权重的步骤包括:基于第一频次与第二频次,获得每个所述历史字符串与发生异常情况的初始权重,其中,所述第一频次为每个所述历史字符串在所述正向文本信息中出现的次数值,所述第二频次为每个所述历史字符串在所述负向文本信息中出现的次数值。在可选的实施方式中,所述初始权重、所述第一频次及所述第二频次满足以下公式:其中,pmi(w,c=1)为第w个历史字符串与发生异常情况的初始权重,p(w|c=1)为第w个历史字符串对应的第一频次,p(w|c=0)为第w个历史字符串对应的第二频次。在可选的实施方式中,所述从所述历史字符串中获取至少一个所述正向字符串的步骤包括:从所述历史字符串中获取至少一个中间字符串,其中,所述中间字符串的初始权重大于或等于所述第一预设阈值;从全部所述中间字符串中获取至少一个所述正向字符串,其中,每个所述正向字符串所包括的每个字符与其他正向字符串所包括的每个字符均不相同。在可选的实施方式中,所述根据全部所述正向字符串的初始权重,得到每个所述正向字符串的权重信息的步骤包括:获得每个所述正向字符串与发生异常情况的最终权重;将所述最终权重作为对应的权重信息。第三方面,本申请实施例提供一种异常情况确定装置,所述装置包括:获取模块,用于获取待检测服务对应的音频信息;所述获取模块,还用于获取所述音频信息对应的文本信息;确定模块,用于根据正向匹配式与所述文本信息,确定所述文本信息与异常情况的相关程度信息;所述正向匹配式与所述异常情况具有正向关系;所述相关程度信息表征所述文本信息与所述异常情况的相关程度值;所述确定模块,还用于当所述相关程度信息大于相关度阈值时,则确定所述待检测服务存在异常。在可选的实施方式中,所述正向匹配式包含至少一个正向字符串,每个所述正向字符串与所述异常情况具有正向关联;所述确定模块,用于将每一个所述正向字符串分别与所述文本信息进行匹配;当所述文本信息存在与所述正向字符串匹配成功的文本时,则将所述正向字符串作为目标字符串;获得全部所述目标字符串对应的正向得分;所述目标字符串对应的正向得分与所述异常情况为正相关;将全部所述目标字符串对应的正向得分作为所述相关程度信息。在可选的实施方式中,所述确定模块,用于获得每个所述目标字符串与对应的文本发生匹配的次数值,及每个所述目标字符串对应的正向字符串的权重信息;根据全部所述次数值和所述权重信息,获得全部所述目标字符串的加权和;将所述加权和作为所述正向得分。在可选的实施方式中,所述异常情况确定装置还包括:删除模块,用于删除所述音频信息中的语音导航信息。第四方面,本申请实施例提供一种正向匹配式生成装置,所述正向匹配式生成装置包括:音频信息获取模块,用于获取至少一个历史行程对应的历史音频信息;转化模块,用于将每个所述历史音频信息转化为历史文本信息;拆分模块,用于对所述历史文本信息进行文本拆分,得到多个历史字符串;权重获得模块,用于获得每个所述历史字符串与发生异常情况的初始权重;字符串获得模块,还从所述历史字符串中获取至少一个正向字符串,其中,所述正向字符串的初始权重大于或等于第一预设阈值;正向匹配式获取模块,用于将全部所述正向字符串作为所述正向匹配式,根据全部所述正向字符串的初始权重,得到每个所述正向字符串的权重信息,其中所述初始权重与所述权重信息正相关。在可选的实施方式中,当所述正向匹配式包括至少一个正向字符串时,所述正向匹配式还包括各个正向字符串之间的逻辑关联信息。在可选的实施方式中,所述历史文本信息包括正向文本信息及负向文本信息,所述正向文本信息表征发生异常情况,所述负向文本信息表征未发生异常情况;所述权重获得模块,用于基于第一频次与第二频次,获得每个所述历史字符串与发生异常情况的初始权重,其中,所述第一频次为每个所述历史字符串在所述正向文本信息中出现的次数值,所述第二频次为每个所述历史字符串在所述负向文本信息中出现的次数值。在可选的实施方式中,所述初始权重、所述第一频次及所述第二频次满足以下公式:其中,pmi(w,c=1)为第w个历史字符串与发生异常情况的初始权重,p(w|c=1)为第w个历史字符串对应的第一频次,p(w|c=0)为第w个历史字符串对应的第二频次。在可选的实施方式中,所述字符串获得模块,用于从所述历史字符串中获取至少一个中间字符串,其中,所述中间字符串的正向得分大于或等于所述第一预设阈值;从全部所述中间字符串中获取至少一个所述正向字符串,其中,每个所述正向字符串所包括的每个字符与其他正向字符串所包括的每个字符均不相同。在可选的实施方式中,所述正向匹配式获取模块,用于获得每个所述正向字符串与发生异常情况的最终权重;将所述最终权重作为对应的权重信息。第五方面,本申请实施例提供一种电子设备,所述电子设备包括处理器、存储器及总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器及所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行前述实施方式任意一项所述的异常情况确定方法的步骤;或者执行前述实施方式任意一项所述的正向匹配式生成方法的步骤。第六方面,本申请实施例提供一种异常情况确定系统,包括相互通信的服务提供方及客户端;所述客户端,用于采集待检测服务对应的音频信息;所述服务提供方,用于获取所述音频信息,获取所述音频信息对应的文本信息,根据正向匹配式与所述文本信息,确定所述文本信息与异常情况的相关程度信息,所述正向匹配式与所述异常情况具有正向关系,所述相关程度信息表征所述文本信息与所述异常情况的相关程度值,当所述相关程度信息大于相关度阈值时,则确定所述待检测服务存在异常。第七方面,本申请实施例提供一种可读存储介质,所述可读存储介质存储有计算机程序,计算机程序被执行时实现前述的异常情况确定方法;或者实现前述实施方式任意一项所述的正向匹配式生成方法。有鉴于此,本申请实施例提供了一种异常情况确定方法、装置、电子设备和可读存储介质,该方法通过获取待检测服务对应的音频信息,再获取音频信息对应的文本信息,利用与异常情况具有正向关系的正向匹配式,确定文本信息与异常情况的相关程度信息,可有效检测待检测服务对应的车辆是否发生交通事故等异常情况,提高了检测交通事故等异常情况的准确性。为使本申请的上述目的、特征和优点能更明显易懂,下文特举一些举例,并配合所附附图,作详细说明。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本申请实施例提供的应用场景示意图。图2为本申请实施例提供的服务提供方的结构框图。图3为本申请实施例提供的正向匹配式生成方法的流程示意图。图4是本申请实施例提供的图3中的步骤s103的子步骤流程示意图。图5是本申请实施例提供的图3中的步骤s104的子步骤流程示意图。图6为本申请实施例提供的异常情况确定方法的流程图。图7为本申请实施例提供的图6中步骤s202的子步骤流程示意图。图8为本申请实施例提供的一种异常情况确定装置的功能模块示意图。图标:1-请求终端;2-服务器;3-车辆;22-存储器;21-处理器;24-异常情况确定装置;241-获取模块;242-确定模块;25-正向匹配式生成装置;26-总线。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。需要说明的是,在不冲突的情况下,本申请的实施例中的特征可以相互结合。交通事故及事故发生后的求助一直是出行安全领域致力于解决的问题,交通事故具有发生频率高,发生后对人身和财产造成严重损失的特点,特别是在人身安全方面,轻则出现人伤,严重的可能会直接造成亡人现象。目前,通常对录音文件直接进行音频分析,例如,提取录音文件中的声纹信息或者频谱信息,来检测车辆是否发生车祸。或者,通过车载设备来判断车辆是否出现急刹车或撞击等现象发生,进而确定是否有交通事故发生。但是由于录音文件中存在大量噪声,上述方法均存在检测准确性欠佳的问题。下面以网约车场景为例,对上述通过录音判断是否发生事故的过程进行介绍。如图1所示,图1为本申请实施例提供的应用场景示意图。该网约车场景包括请求终端1、服务器2以及车辆3。所述请求终端1、服务器2以及车辆3之间,通过网络建立通信连接。请求终端1可以是用户所持有的终端,车辆通过服务器接收网约车服务订单,从而为用户提供网约车服务,将用户送往欲前往目的地。其中,请求终端1可以是有多个,所述车辆3也可以有多辆。请求终端1向该服务器2发送订单请求,其中,该订单请求携带有该请求终端1当前位置信息以及该请求终端1的用户欲前往目的地的位置信息。该服务器2获取到订单请求后,基于该请求终端1的位置信息,从距离该请求终端1预设距离范围内的多个车辆中选取服务车辆,并将包含该请求终端的导航信息的服务订单发送给服务车辆,使得该服务车辆通过该导航信息前往请求终端所在的地点。进一步地,服务车辆在接到该请求终端的用户后,将该请求终端的用户送往预前往的目的地。服务车辆通过导航信息前往请求终端1所在的地点的过程中,有可能发生交通事故等异常情况,或者,服务车辆在将该请求终端1对应的用户送往目的地过程中,也有可能发生交通事故等异常情况。在发生交通事故等异常情况后,及时地为服务车辆中的司机与乘客提供救援可较大程度地挽回生命或财产损失,因此,判断服务车辆是否发生交通事故等异常情况显得尤为重要。下面提供一种可能的实现方式,对目前的救援方式进行示例性说明。该服务车辆在整个行驶过程中进行声音采集,将采集的音频数据发送给服务器。服务器基于音频数据中的频谱信息或者声纹信息进行异常事故分析,从中查找出碰撞声、尖叫声或哭泣声。进而确定服务车辆是否发生交通事故等异常事故。然而,上述这种对录音文件直接进行音频分析,检测是否发生异常情况的分析方式均是对声音本身的特征进行分析,均存在检测准确性欠佳的问题。鉴于此,本申请实施例提供一种异常情况确定系统。作为一种可能的实施方式,本申请实施例以该系统应用于上述网约车场景为例,对该异常情况确定系统做详细说明。该异常情况确定系统包括相互通信的客户端及服务提供方。该客户端可以是上述网约车场景中的车辆的司机所使用的终端或乘坐该车辆的乘客所使用的终端,例如图1中的请求终端1,该上搭载有服务软件,通过终端采集音频信息后,通过该服务软件将采集到的音频信息发送至服务提供方。该服务提供方可以是图1中的服务器2。客户端在车辆行驶过程中采集音频信息,将采集的音频信息发送给服务提供方。服务提供方,用于提取音频信息中的关键信息,进而利用关键信息与异常情况的映射关系分析处理获得关键信息与异常情况的相关度,进而确定该音频信息对应的服务过程中是否发生异常。结合上述异常情况确定系统所提供的方案,下面以本申请实施例所提供的服务提供方为图1中的服务器2为例,对该服务器2做进一步说明。请结合参阅图2,图2为本申请实施例提供的一种服务器的结构框图,该服务器可以为上述图1中的服务器2。在一种实现方式中,本申请实施例提供的异常情况确定方法和/或正向匹配式生成方法应用于图2所示的服务器2,由服务器2执行本申请实施例所提供的异常情况确定方法和/或正向匹配式生成方法。可选的,正向匹配式生成方法可在服务器2中执行,并且服务器2还执行本申请实施例提供的异常情况确定方法。而在另一种场景则可以是服务器2执行本申请实施例所提供的异常情况确定方法,而其他电子设备执行正向匹配式生成方法,或者,还可以是服务器2执行本申请实施例所提供的正向匹配式生成方法,而其他电子设备执行异常情况确定方法。作为一种可能的实时场景,服务器2包括处理器21、存储器22、总线26、异常情况确定装置24及正向匹配式生成装置25,所述存储器22存储有所述处理器21可执行的机器可读指令,当服务器2运行时,所述处理器21及所述存储器22之间通过总线26通信,所述处理器21执行所述机器可读指令,并执行异常情况确定方法或正向匹配式生成方法的步骤。所述存储器22、处理器21以及其他各元件相互之间直接或间接地电性连接,以实现信号的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。异常情况确定装置24包括至少一个可以软件或固件(firmware)的形式存储于所述存储器22中的软件功能模块。所述处理器21用于执行存储器22中存储的可执行模块,例如所述异常情况确定装置24和/或正向匹配式生成装置25所包括的软件功能模块或计算机程序。可选地,异常情况确定装置24可以为本申请实施例提供的异常情况确定方法所对应的软件功能模块或计算机程序,正向匹配式生成装置25可以为本申请实施例提供的正向匹配式生成方法所对应的软件功能模块或计算机程序。其中,存储器22可以是,但不限于,随机读取存储器(randomaccessmemory,ram),只读存储器(readonlymemory,rom),可编程只读存储器(programmableread-onlymemory,prom),可擦除只读存储器(erasableprogrammableread-onlymemory,eprom),电可擦除只读存储器(electricerasableprogrammableread-onlymemory,eeprom)等。在一些实施例中,处理器21可以处理与服务请求有关的信息和/或数据,以执行本申请中描述的一个或多个功能。在一些实施例中,处理器21可以包括一个或多个处理核(例如,单核处理器(s)或多核处理器(s))。仅作为举例,处理器可以包括中央处理单元(centralprocessingunit,cpu)、专用集成电路(applicationspecificintegratedcircuit,asic)、专用指令集处理器(applicationspecificinstruction-setprocessor,asip)、图形处理单元(graphicsprocessingunit,gpu)、物理处理单元(physicsprocessingunit,ppu)、数字信号处理器(digitalsignalprocessor,dsp)、现场可编程门阵列(fieldprogrammablegatearray,fpga)、可编程逻辑器件(programmablelogicdevice,pld)、控制器、微控制器单元、简化指令集计算机(reducedinstructionsetcomputing,risc)或微处理器等,或其任意组合。本申请实施例任一实施方式所揭示的流程定义的方法可以应用于处理器21中,或者由所述处理器21实现。可以理解,图2所示的结构仅为示意。服务器2还可以具有比图2所示更多或者更少的组件,或者具有与图2所示不同的配置。图2所示的各组件可以采用硬件、软件或其组合实现。例如,服务器2还可以提供一人机交互界面。当通过上述异常情况确定系统中所提供的方案初步确定出待检测服务存在异常时,还可将存在异常的待检测服务对应的音频信息发送至人机交互界面,使得相关安全人员进一步对音频信息做专业分析,进一步确定待检测服务是否发生异常情况,从而使得相关安全人员采取救援措施,例如,安排相应的求援人员前往事故发生地点,或者帮助拨打救援电话。基于上述异常情况确定系统的实现架构及服务器2的结构,作为一种可能的实现方式,为了建立关键信息与异常情况的关系,本申请引入“正向匹配式”的概念,其作用在于便于从音频信息中提取关键信息。具体的,本申请提供了一种正向匹配式生成方法,该方法用于生成正向匹配式,使得图1中的服务器2可利用正向匹配式提取音频信息中的关键信息,进而利用关键信息与异常情况的映射关系分析处理获得关键信息与异常情况的相关度,从而确定该音频信息对应的服务过程中是否发生异常。请结合参阅图3,图3为本申请实施例提供的正向匹配式生成方法的流程示意图。下面对正向匹配式生成方法的步骤进行详细阐述。步骤s100,获取至少一个历史行程对应的历史音频信息。例如,该历史行程可以理解为服务车辆已经完成且知晓是否发生异常情况的服务行程;该历史行程的音频数据可通过驾驶该服务车辆的司机所使用的终端或乘坐该服务车辆的乘客所使用的终端采集,并存储于数据库、图1中示出的服务器2或其他设备中,同时,历史行程可包括多个已发生异常情况的行程,和多个未发生异常情况的行程。步骤s101,将每个历史音频信息转化为历史文本信息。例如,可通过自动语音识别技术(automaticspeechrecognition,asr)将每个历史音频信息转化为历史文本信息。步骤s102,对历史文本信息进行文本拆分,得到多个历史字符串。其中,历史字符串可以是历史文本信息中包括的语句、词语、或者单个字。例如,历史文本信息为“我马上到了,你再等等我。”则对该历史文本信息进行文本拆分后,得到的多个历史字符串可以包括:“你再等等我”、“马上”和“我”。步骤s103,获得每个历史字符串与发生异常情况的初始权重。该异常情况可以理解为车辆在行驶过程中出现了危及乘客、司机或他人安全的情况,例如,车辆在行驶过程中出现了交通事故。该初始权重越高,表示该历史字符串与发生异常情况的相关性越大。步骤s104,从历史字符串中获取至少一个正向字符串,其中,正向字符串的初始权重大于或等于第一预设阈值。可选地,由于拆分出的多个历史字符串可能包括与发生交通事故等异常情况并无关系的历史字符串,例如,“吃饭”,“右转”等,其与发生交通事故等异常情况的初始权重较低。因此,可通过设定的第一预设阈值,过滤掉初始权重低于第一预设阈值的历史字符串,得到正向字符串。其中,该第一预设阈值可以取0.1-1。可以理解的是,该第一预设阈值可以根据实际应用中的需求设定,在此不做限制。步骤s105,将全部正向字符串作为正向匹配式,根据全部正向字符串的初始权重,得到每个正向字符串的权重信息,其中初始权重与权重信息正相关。例如,在一种可能的实现方式中,可直接将每个正向字符串的初始权重,作为对应的权重信息,从而得到每个正向字符串的权重信息。又例如,可根据初始权重确定每个正向字符串所对应的权重信息。可选地,可对全部正向字符串所对应的初始权重,进行归一化处理,得到对应的权重信息。作为一种可能的实施场景,正向匹配式包括的正向字符串以及每个正向字符串对应的权重信息可表1所示:表1正向字符串车祸打110受伤拨120权重信息0.40.20.10.3可以理解的是,上述表格中的举例仅仅为更清楚地说明正向字符串与其对应的权重信息,实际应用中,正向字符串不仅仅限于上述表格中示出的例子,还可以包括其他与发生异常情况相关性较高的词语。上述生成正向匹配式的过程,既可以是基于上述异常情况确定系统中包括的服务提供方执行,也可以是基于其他外部电子设备执行。本申请实施例通过将历史音频信息转化为历史文本信息,并对历史文本信息进行拆分,得到多个历史字符串,并从历史字符串中获取初始权重大于或等于第一预设阈值的正向字符串,从而从历史音频信息中挖掘出与发生异常情况具有正向关联的正向匹配式,使得后续处理中可通过正向匹配式提取待检测服务的音频信息中的关键信息,从而确定该待检测服务是否发生异常,以提高检测交通事故等异常情况的准确性。作为一种可能的实施方式,可通过n-gram语言模型对历史文本信息进行文本拆分,得到多个历史字符串。例如,该n-gram语言模型可以是汉语语言模型(chineselanguagemodel,clm)。可选地,可将历史文本信息拆分为包括n个字组成的历史字符串,n可以取3、4、5…等自然数。例如,n取2,将“我爱你”进行文本拆分可得到:“我爱”、和“爱你”共2个历史字符串。又例如,n取3,将“出车祸了”进行文本拆分可得到:“出车祸”和“车祸了”,共2个互不重复的历史字符串。经发明人研究发现,互信息(mutualinformation,mi)作为一种相关性指标,通常可以用于计算两个变量之间的相关性,而点互信息(pointwisemutualinformation,pmi)是其衍生出来的,用于评估两个变量的具体取值的相关性。在本申请实施例的正向匹配式挖掘中,主要目标是想挖掘一些与正向文本信息(发生交通事故的行程服务)相关的关键词,因此在一种可能的实现方式中,可以利用点互信息挖掘历史文本信息,以构成上述正向匹配式。进一步地,当某一历史字符串在历史文本信息中出现的频次越多,越能反应该历史字符串与出现异常情况的相关性越大,因此,可基于历史字符串在不同历史文本信息中出现的频次,结合上述点互信息算法计算历史字符串与异常情况之间的初始权重,通过初始权重筛选得到正向字符串。作为一种可能的实施方式,在图3的基础上,图4为本申请实施例提供的图3中步骤s103的子步骤流程示意图。请结合参阅图4,步骤s103的一种可能的实施方式为:步骤103-1,基于第一频次与第二频次,获得每个历史字符串与发生异常情况的初始权重。其中,第一频次为每个历史字符串在正向文本信息中出现的次数值,第二频次为每个历史字符串在负向文本信息中出现的次数值。其中,当历史行程既包括已定发生了异常情况的行程,同时还包括了未发生异常情况的行程。则历史文本信息包括正向文本信息及负向文本信息,正向文本信息表征发生异常情况,负向文本信息表征未发生异常情况。进一步地,本申请实施例中,初始权重、第一频次及第二频次满足以下公式(1):其中,pmi(w,c=1)为第w个历史字符串与发生异常情况的初始权重,p(w|c=1)为第w个历史字符串对应的第一频次,p(w|c=0)为第w个历史字符串对应的第二频次。其中,初始权重、第一频次及第二频次所满足的公式可通过以下公式(2)推导得到:公式(2)中w表示第w个历史字符串,c=1表示正向文本信息,c=0表示负向文本信息,p(w|c=1)即为第w个历史字符串在正向文本信息中出现的频次,p(w|c=0)即为第w个历史字符串在负向文本信息中出现的频次。公式(2)中第一步为pmi的定义式,第二步为分母的全概率展开,第三步中使用了先验的简化假设,由于发生交通事故的历史行程占比相对于所有历史行程来说是极低的,因此近似认为c=1的概率为0,而c=0的概率为1,从而得到最后的公式。通过上述公式对每个历史字符串计算pmi值,也就是上述初始权重,可以量化地评估每个历史字符串与发生异常情况的相关性。当通过n-gram语言模型对历史文本信息进行文本拆分时,由于n可取不同的多种取值,因此,对于同一句话,按照不同的组成数n进行拆分时,得到的字符串可能包括有意义重复的字符串。例如:“人受伤了”这句话,当n取4时,通过上述步骤s300-s600,可能得到内容为“人受伤了”的正向字符串。当n取3时,可能得到内容为“人受伤”和“受伤了”的正向字符串,当n取2时,可能得到内容为“受伤”和“伤了”的正向字符串。基于上述情况,由于获取到的正向字符串中包括大量意义重复的字符串,为了减少实际应用时的计算量,还可通过以下步骤对正向字符串做进一步筛选,在保证检测准确率的前提下,减少计算量。请结合参阅图5,图5是本申请实施例提供的图3中的步骤s104的子步骤流程示意图。步骤s104的一种可选的实现方式为:步骤s104-1,从历史字符串中获取至少一个中间字符串,其中,中间字符串的初始权重大于或等于第一预设阈值。可选地,该第一预设阈值可以取0.1-1。可以理解的是,该第一预设阈值可以根据实际应用中的需求设定,在此不做限制。步骤s104-2,从全部中间字符串中获取至少一个正向字符串,其中,每个正向字符串所包括的每个字符与其他正向字符串所包括的每个字符均不相同。例如,正向字符串可以包括:“受伤”、“车祸”、“追尾”等。可选地,为了使得减少利用正向匹配式计算关键信息与发生异常情况的相关性时的计算量,还可通过以下步骤对正向字符串做进一步筛选,图5中步骤s104-2的一种可能的实现方式为:将每个中间字符串中包括的字符与其他中间字符串中包括的字符一一比对,当存在包括相同字符的多个中间字符串时,则权重信息最大的中间字符串作为正向字符串。例如,中间字符串包括:“人受伤了”、“人受伤”、“受伤了”、“受伤”、“车祸”、“出车祸了”。将每个中间字符串中包括的字符与其他中间字符串中包括的字符一一比对可知,多个中间字符串及对应的权重信息分别为:“人受伤了-0.2”、“人受伤-0.2”、“受伤了-0.3”及“受伤-0.4”均包括相同的字符“伤”,同时,中间字符串“受伤”的权重信息最大。因此,可以选取中间字符串“受伤”作为正向字符串。同时,多个中间字符串及对应的权重信息分别为:“车祸-0.3”、“出车祸了0.1”均包括相同的字符“车祸”,同时,中间字符串“车祸”的权重信息最大。因此,可以任意选取中间字符串“车祸”作为正向字符串。如此,基于上述实施方式,可以得到包括:“受伤”以及“车祸”两个正向字符串的正向匹配式。避免出现多个意义重复的正向匹配式,从而降低利用正向匹配式计算发生异常情况的相关得分时的计算量。进一步地,由于正向字符串所包括的字符长度越长,其所表达的语言含义越具体,正向字符串所包含的字符长度越短,其泛化能力越强。例如,正向字符串a为“发生车祸了”,只有当文本信息中包含完整的“发生车祸了”的文本时,才会将该正向字符串a出现的频次做统计。若文本信息中未包含“发生车祸了”的文本信息,而是包括“出车祸了”的文本时,则该正向字符串a则不会与文本信息匹配。而当正向字符串a为“车祸”时,不论文本信息中出现的是“发生车祸了”还是“出车祸了”,该正向字符串a均能与文本信息匹配。从而没有遗漏地进一步基于匹配的频次做挖掘,显而易见地,正向字符串所包含的字符长度越短,其泛化能力越强。因此,在另一种可能的实现方式中,为了提高应用时的计算效率和准确率,当多个中间字符串之间的权重信息差别不大时,可采用字符长度较短的中间字符串作为正向字符串。具体的,图5中步骤s104-2的另一种可选的实现方式为:将每个中间字符串中包括的字符与其他中间字符串中包括的字符一一比对,当存在包括相同字符的多个中间字符串,且每个中间字符串对应的权重信息的差值小于预设阈值时,则选取字符长度最短的中间字符串作为正向字符串。例如,中间字符串及对应的权重信息分别包括:“人受伤了-0.2”、“人受伤-0.2”、“受伤了-0.2”、“受伤-0.2”、“车祸-0.3”、“出车祸了-0.3”。将每个中间字符串中包括的字符与其他中间字符串中包括的字符一一比对可知,多个中间字符串:“人受伤了”、“人受伤”、“受伤了”及“受伤”均包括相同的字符“伤”,且对应的权重信息均相同。同时,中间字符串“受伤”所包括的字符长度最短,因此,可以选取“受伤”作为正向字符串。同时,多个中间字符串:“车祸”、“出车祸了”均包括相同的字符“车祸,且对应的权重信息均相同。同时,中间字符串“车祸”所包括的字符长度最短,因此,可以选取“车祸”作为正向字符串。如此,基于上述实施方式,可以得到包括:“受伤”以及“车祸”两个正向字符串的正向匹配式。相较于“人受伤了”以及“出车祸了”,字符较短的“受伤”以及“车祸”其对待检测数据的泛化能力更好,从而可提高实际应用过程中的检测准确率。进一步地,当正向匹配式包括至少一个正向字符串时,正向匹配式还包括各个正向字符串之间的逻辑关联信息。例如,可以是将两个正向字符串通过逻辑关系关联在一起,例如,一种通过多个正向字符串构成的正向匹配式可以为:(打|拨)(120|110)。其中,“打”与“拨”的逻辑关联信息为“或者”。“打|拨”与“120|110”的逻辑关联信息为“和”。作为一种可能的实施场景,当正向匹配式还包括各个正向字符串之间的逻辑关联信息时,正向匹配式列表可如表2所示:表2正向字符串车祸(打|拨)(120|110)受伤权重信息0.40.50.1对比表1及表2可知,表1中具有相似关系的正向字符串“打110”以及“拨120”通过逻辑关系进一步关联在一起得到表2中的正向字符串“(打|拨)&(120|110)”,如此,可进一步提升正向匹配式的泛化能力,从而提高检测异常情况的准确率。进一步地,当正向匹配式还包括各个正向字符串之间的逻辑关联关系时,由于这种正向匹配式是由至少一个正向字符串通过逻辑关联关系得到,在历史文本信息中的计算频次发生了变化,因此,为了提高其权重信息的准确性,还可以进一步地重新获取正向字符串的权重信息。作为一种可选的实施方式,可获得每个正向字符串与发生异常情况的最终权重,将最终权重作为对应的权重信息。例如,可结合上文图4中的步骤s103-1,重新获得第一频次,即每个正向字符串在正向文本信息中出现的次数值,重新获得第二频次,即每个正向字符串在负向文本信息中出现的次数值。利用第一频次,第二频次及上述公式重新得到每个正向字符串与发生异常情况的最终权重,将最终权重作为对应的权重信息。以提高每个正向字符串对应的权重信息的准确性。本申请实施例还提供了一种异常情况确定方法,该方法可基于上述方法生成的正向匹配式,对服务过程中获取的音频信息进行分析,确定文本信息与异常情况的相关程度信息,从而目前改善检测交通事故等异常情况的准确性较低的问题。本申请实施例还提供了一种异常情况确定方法,该方法可通过上述图1中的服务车辆或者服务器执行。该异常情况确定方法可通过图3中的方法得到与异常情况存在正向关联的正向匹配式,通过正向匹配式提取音频信息中的关键信息,进而利用关键信息与异常情况的映射关系分析处理获得关键信息与异常情况的相关度,从而确定该音频信息对应的服务过程中是否发生异常。请结合参阅图6,图6为本申请实施例提供的异常情况确定方法的流程图。下面同样以网约车场景,对图6所示的流程示意图进行详细阐述。步骤s200,获取待检测服务对应的音频信息。其中,待检测服务可以是服务车辆当前正在进行的服务行程,该音频信息可以是通过该服务车辆中乘客的终端或者司机的终端所采集到的录音。步骤s201,获取音频信息对应的文本信息。步骤s202,根据正向匹配式与文本信息,确定文本信息与异常情况的相关程度信息,其中,正向匹配式与异常情况具有正向关系,相关程度信息表征文本信息与异常情况的相关程度值。其中,正向匹配式与异常情况具有正向关系,该正向匹配式可以理解为发生异常情况时,音频信息中经常出现的词语或句子,例如:车祸、追尾、受伤等。正向匹配式可以是通过图3中示出的方法在其他电子设备中挖掘生成后迁移至当前服务车辆或服务器中的,也可以是在当前服务车辆或服务器中提前挖掘生成并储存得到的。步骤s203,当相关程度信息大于相关度阈值时,则确定待检测服务存在异常情况。其中,相关度阈值可以为0.1-1。可以理解的是,该相关度阈值可以根据实际应用中的需求设定,在此不做限制。本申请实施例通过获取待检测服务对应的音频信息,再获取音频信息对应的文本信息,利用与异常情况具有正向关系的正向匹配式,确定文本信息与异常情况的相关程度信息,可有效检测待检测服务对应的车辆是否发生交通事故等异常情况,提高了检测交通事故等异常情况的准确性。可选地,下面以图1示出的网约车场景中的服务器为执行主体对上述方法步骤进行详细阐述。可选地,步骤s201的一种可能的实现方式为:通过asr将每个音频信息转化为文本信息。将每个音频信息转化为文本信息,可快速基于正向匹配式挖掘音频信息中包含的有效信息,排除噪音等干扰。例如,可直接删除文本信息中导航语音所对应的文本。进一步地,由于文本信息中可能包括多个与正向字符串匹配的文本,基于所有与正向字符串存在匹配关系的文本即可反应文本信息与发生异常情况之间的关联,因此,作为一种可选的实施方式,可通过以下方式实现步骤s202,确定文本信息与异常情况的相关程度信息。请结合参阅图7,图7为本申请实施例提供的图6中步骤s202的子步骤流程示意图。步骤s202-1,将每一个正向字符串分别与文本信息进行匹配。步骤s202-2,当文本信息存在与正向字符串匹配成功的文本时,则将正向字符串作为目标字符串。步骤s202-3,获得全部目标字符串对应的正向得分,目标字符串对应的正向得分与异常情况为正相关。步骤s202-4,将全部目标字符串对应的正向得分作为相关程度信息。其中,正向匹配式包含至少一个正向字符串,每个正向字符串与异常情况具有正向关联。例如,当异常情况为发生交通事故时,其具有正向关联的正向匹配式所包括的正向字符串可以分别为:“车祸”、“受伤”、“撞人”、“打110”、“打120”及“追尾”等。由于不同的正向字符串所对应的权重信息不同,其与发生异常情况的相关性也不同,同时正向字符串在文本信息中出现的频次也可反应其与发生异常情况的相关性,因此可通过频次及权重信息计算全部目标字符串对应的正向得分。步骤s202-3的一种可能的实施方式为:获得每个目标字符串与对应的文本发生匹配的次数值,及每个目标字符串对应的正向字符串的权重信息。根据全部次数值和权重信息,获得全部目标字符串的加权和。将加权和作为正向得分。例如,作为一种可能的实施场景,文本信息可以是“出车祸了,有人受伤了,快打120”。假设正向字符串分别包括“车祸”、“受伤”、“撞人”及“追尾”。每个正向字符串对应的权重得分,分别为0.3、0.2、0.2及0.3。如表3所示:表3正向字符串车祸受伤撞人追尾权重得分0.30.20.20.3将每个正向字符串与文本信息进行匹配,可以得到匹配成功的目标字符串“车祸”及“受伤”。基于上述表3可知,目标字符串“车祸”对应的权重信息为0.3,目标字符串“受伤”对应的权重信息为0.2。每个目标字符串对应的文本发生匹配的次数值均为1。则计算全部目标字符串的加权和有:1*0.3+1*0.2=0.5。正向得分等于加权和为0.5。如此,本申请实施例通过将待检测服务对应的音频信息转化为文字信息,并进一步基于正向匹配式与文本信息确定文本信息与异常情况的相关程度信。一方面,可有效判定是否发生交通事故等异常情况,通过正向匹配式查找文本信息,可提高检测交通事故等异常情况的准确性。另一方面,可基于正向匹配式所表达的含义,确定待检测服务对应的车辆发生交通事故等异常情况时现场情况。基于同一发明构思,本申请实施例中还提供了与上述异常情况确定方法对应的异常情况确定装置。请结合参阅图8,图8为本申请实施例提供的一种异常情况确定装置24的功能模块示意图,该装置包括:获取模块241,用于获取待检测服务对应的音频信息。获取模块241,还用于获取音频信息对应的文本信息。确定模块242,用于根据正向匹配式与文本信息,确定文本信息与异常情况的相关程度信息;正向匹配式与异常情况具有正向关系;相关程度信息表征文本信息与异常情况的相关程度值。确定模块242,还用于当相关程度信息大于相关度阈值时,则确定待检测服务存在异常。在可选的实施方式中,所述正向匹配式包含至少一个正向字符串,每个所述正向字符串与所述异常情况具有正向关联。所述确定模块,用于将每一个所述正向字符串分别与所述文本信息进行匹配。当所述文本信息存在与所述正向字符串匹配成功的文本时,则将所述正向字符串作为目标字符串。获得全部所述目标字符串对应的正向得分;所述目标字符串对应的正向得分与所述异常情况为正相关。将全部所述目标字符串对应的正向得分作为所述相关程度信息。在可选的实施方式中,所述确定模块,用于获得每个所述目标字符串与对应的文本发生匹配的次数值,及每个所述目标字符串对应的正向字符串的权重信息。根据全部所述次数值和所述权重信息,获得全部所述目标字符串的加权和。将所述加权和作为所述正向得分。在可选的实施方式中,所述异常情况确定装置还包括:删除模块,用于删除所述音频信息中的语音导航信息。由于本申请实施例中的装置解决问题的原理与本申请实施例上述异常情况确定方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。基于同一发明构思,本申请实施例中还提供了与上述正向匹配式生成方法对应的正向匹配式生成装置,所述正向匹配式生成装置包括:音频信息获取模块,用于获取至少一个历史行程对应的历史音频信息。转化模块,用于将每个所述历史音频信息转化为历史文本信息。拆分模块,用于对所述历史文本信息进行文本拆分,得到多个历史字符串。权重获得模块,用于获得每个所述历史字符串与发生异常情况的初始权重。字符串获得模块,还从所述历史字符串中获取至少一个正向字符串,其中,所述正向字符串的初始权重大于或等于第一预设阈值。正向匹配式获取模块,用于将全部所述正向字符串作为所述正向匹配式,根据全部所述正向字符串的初始权重,得到每个所述正向字符串的权重信息,其中所述初始权重与所述权重信息正相关。在可选的实施方式中,当所述正向匹配式包括至少一个正向字符串时,所述正向匹配式还包括各个正向字符串之间的逻辑关联信息。在可选的实施方式中,所述历史文本信息包括正向文本信息及负向文本信息,所述正向文本信息表征发生异常情况,所述负向文本信息表征未发生异常情况。所述权重获得模块,用于基于第一频次与第二频次,获得每个所述历史字符串与发生异常情况的初始权重,其中,所述第一频次为每个所述历史字符串在所述正向文本信息中出现的次数值,所述第二频次为每个所述历史字符串在所述负向文本信息中出现的次数值。在可选的实施方式中,所述初始权重、所述第一频次及所述第二频次满足以下公式:其中,pmi(w,c=1)为第w个历史字符串与发生异常情况的初始权重,p(w|c=1)为第w个历史字符串对应的第一频次,p(w|c=0)为第w个历史字符串对应的第二频次。在可选的实施方式中,所述字符串获得模块,用于从所述历史字符串中获取至少一个中间字符串,其中,所述中间字符串的正向得分大于或等于所述第一预设阈值。从全部所述中间字符串中获取至少一个所述正向字符串,其中,每个所述正向字符串所包括的每个字符与其他正向字符串所包括的每个字符均不相同。在可选的实施方式中,所述正向匹配式获取模块,用于获得每个所述正向字符串与发生异常情况的最终权重。将所述最终权重作为对应的权重信息。由于本申请实施例中的装置解决问题的原理与本申请实施例上述正向匹配式生成方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。本申请实施例也提供了一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序被执行时实现上述的异常情况确定方法或正向匹配式生成方法。综上所述,本申请实施例提供了一种异常情况确定方法和正向匹配式生成方法,该异常情况确定方法通过获取待检测服务对应的音频信息,并获取音频信息对应的文本信息。然后根据正向匹配式与文本信息,确定文本信息与异常情况的相关程度信息,其中,正向匹配式与异常情况具有正向关系,相关程度信息表征文本信息与异常情况的相关程度值。当相关程度信息大于相关度阈值时,则确定待检测服务存在异常情况。如此,一方面,可有效判定是否发生交通事故等异常情况,提高检测交通事故等异常情况的准确性。另一方面,可基于正向匹配式所表达的含义,确定待检测服务对应的车辆发生交通事故等异常情况时现场情况。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本
技术领域:
的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。当前第1页1 2 3 
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除
相关标签: 文本分析
热门咨询
tips