HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

安防报警方法、装置、系统及设备与流程

2021-01-28 14:01:20|289|起点商标网
安防报警方法、装置、系统及设备与流程

本申请涉及智能安防技术领域,特别是涉及安防报警方法、装置、系统及设备。



背景技术:

随着人们安全意识的逐步上升及监控设备的普及,安全防护成为热门研究课题。传统的安防报警设备,一般采用温度、激光等方式触发安防报警,应用范围小且容易产生误报警的情况。随着机器学习算法的出现,安防报警有了新的发展方向。

相关基于机器学习算法的安防报警方法中,获取指定监控场景的图像信息,通过预设机器学习算法对图像信息进行分析,从而确定是否进行报警。但是,图像信息有着先天的劣势,那就是对光线敏感,在光照不足的场景下,报警可靠性将大大降低。



技术实现要素:

本申请实施例的目的在于提供一种安防报警方法、装置、系统及设备,以实现在光照不足的场景中,增加报警的可靠性。具体技术方案如下:

第一方面,本申请实施例提供了一种安防报警设备,所述设备包括:

音频采集组件、处理器及通信组件;所述处理器分别与所述音频采集组件及所述通信组件连接;

所述音频采集组件用于采集音频流;

所述通信组件用于进行网络通信;

所述处理器用于对所述音频流进行分析,确定所述音频流中是否检测到了目标情绪类型;在所述音频流中检测到了所述目标情绪类型时,通过所述通信组件向服务器发送报警信息。

可选的,所述音频采集组件还用于:对所述音频流进行语音端点检测,判断所述音频流中是否有语音信息;在所述音频流中有语音信息时,向所述处理器发送所述语音信息;

所述对所述音频流进行分析,确定所述音频流中是否检测到了目标情绪类型,包括:

通过预设算法模型对所述语音信息进行分析,确定所述音频流中是否检测到了目标情绪类型。

可选的,所述通过预设算法模型对所述语音信息进行分析,确定所述音频流中是否检测到了目标情绪类型,包括:

利用预设算法模型,提取所述语音信息的语音纹理特征,对所述语音信息的语音纹理特征进行分析,得到所述语音信息的语音语义特征,并对所述语音语义特征进行分析,确定所述音频流中是否检测到了目标情绪类型。

可选的,所述处理器还用于:通过所述通信组件从所述服务器下载模型更新数据;利用所述模型更新数据对所述预设算法模型进行更新。

可选的,所述处理器还用于:通过所述通信组件向所述服务器发送所述语音信息,以使所述服务器按照所述语音信息生成所述模型更新数据。

第二方面,本申请实施例提供了一种安防报警系统,所述系统包括如上述第一方面任一所述的安防报警设备及服务器;

所述服务器用于:在接收到所述安防报警设备的报警信息后,按照所述安防报警设备对应的报警规则进行报警推送。

可选的,所述服务器还用于获取所述安防报警设备发送的语音信息,按照所述语音信息对所述安防报警设备对应的预设算法模型进行更新,得到模型更新数据;

所述服务器还用于在接收到所述安防报警设备的模型更新请求后,向所述安防报警设备发送所述模型更新数据。

第三方面,本申请实施例提供了一种安防报警方法,所述方法包括:

获取指定场景中的音频流;

对所述音频流进行分析,确定所述音频流中是否检测到了目标情绪类型;

在所述音频流中检测到了所述目标情绪类型时,发送报警信息。

可选的,所述对所述音频流进行分析,确定所述音频流中是否检测到了目标情绪类型,包括:

过滤所述音频流中的静音片段,得到所述音频流的语音信息;

提取所述语音信息的语音纹理特征;

对所述语音信息的语音纹理特征进行分析,得到所述语音信息的语音语义特征;

对所述语音语义特征进行分析,确定所述音频流中是否检测到了目标情绪类型。

可选的,本申请实施例的安防报警方法还包括:从所述服务器下载模型更新数据;利用所述模型更新数据对所述预设算法模型进行更新。

可选的,本申请实施例的安防报警方法还包括:通过向所述服务器发送所述语音信息,以使所述服务器按照所述语音信息生成所述模型更新数据。

第四方面,本申请实施例提供了一种安防报警装置,所述装置包括:

音频采集模块,用于获取指定场景中的音频流;

情绪识别模块,用于对所述音频流进行分析,确定所述音频流中是否检测到了目标情绪类型;

报警关联模块,用于在所述音频流中检测到了所述目标情绪类型时,发送报警信息。

可选的,所述情绪识别模块,包括:

静音片段过滤子模块,用于过滤所述音频流中的静音片段,得到所述音频流的语音信息。

纹理特征提取子模块,用于提取所述语音信息的语音纹理特征。

语义特征提取子模块,用于对所述语音信息的语音纹理特征进行分析,得到所述语音信息的语音语义特征。

情绪类型确定子模块,用于对所述语音语义特征进行分析,确定所述音频流中是否检测到了目标情绪类型。

可选的,本申请实施例的安防报警装置还包括:

算法模型更新模块,用于从所述服务器下载模型更新数据;利用所述模型更新数据对所述预设算法模型进行更新。

可选的,本申请实施例的安防报警装置还包括:

样本数据上传模块,用于通过向所述服务器发送所述语音信息,以使所述服务器按照所述语音信息生成所述模型更新数据。

第五方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第三方面任一所述的安防报警方法。

本申请实施例提供的安防报警方法、装置、系统及设备,采集音频流;对上述音频流进行分析,确定上述音频流中是否检测到了目标情绪类型;在上述音频流中检测到了上述目标情绪类型时,向服务器发送报警信息。通过采集音频流实现安防报警,光照因素影响小,能够增加没有光照或者光照不足的情况下安防报警的可靠性。并且通过检测音频流中的目标情绪类型进行报警,相比于检测关键词进行报警的实用性更强,这是因为人在遇到危险时,通常无法正常的进行语音发音,从而导致关键词的识别率大大下降,使得利用关键词进行语音报警的应用变得无效。本申请对语音表达的情绪进行分析,当识别到目标情绪类型(例如恐慌等)时进行报警操作,实际可行性更高。当然,实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1a为本申请实施例的安防报警设备的第一种示意图;

图1b为本申请实施例的安防报警设备的第二种示意图;

图2为本申请实施例的预设算法模型的一种示意图;

图3为本申请实施例的安防报警系统的一种示意图;

图4为本申请实施例的安防报警方法的第一种示意图;

图5为本申请实施例的安防报警方法的第二种示意图;

图6为本申请实施例的安防报警装置的一种示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

发明人在研究中发现,在目前的安防报警系统中,大多是基于图像信息的检测,但是图像信息有着上述的先天的劣势,在没有光照或者光照不足的情况下,可靠性将大大降低。有鉴于此,本申请实施例提供了一种安防报警设备,参见图1a,该设备包括:

音频采集组件101、处理器102及通信组件103;上述处理器102分别与上述音频采集组件101及上述通信组件103连接;

上述音频采集组件101用于采集音频流;

上述通信组件103用于进行网络通信;

上述处理器102用于对上述音频流进行分析,确定上述音频流中是否检测到了目标情绪类型;在上述音频流中检测到了上述目标情绪类型时,通过上述通信组件103向服务器发送报警信息。

音频采集组件101用于采集安防报警设备安装场景中的声音,得到音频流。处理器102基于预设机器学习算法,对音频流进行分析,确定音频流中是否检测到了目标情绪类型。其中,目标情绪类型可以按照实际情况进行设定,例如可以包括焦虑、急躁、恐慌及愤怒等情绪中的一种或多种。在音频流中检测到目标情绪类型时,处理器102通过通信组件103向服务器发送报警信息。

预设机器学习算法可以采用end-to-end(端到端)的训练方法进行训练,预设机器学习算法的训练过程可以包括:通过标定了情绪类型的样本声音对深度学习网络,例如lstm(longshort-termmemory,长短期记忆网络)或dfsmn(deepfeedforwardsequentialmemorynetworks,深度前馈序列记忆神经网络)等,进行训练,收敛后得到预设机器学习算法。

在一种可能的实施方式中,参见图1b本申请实施例的安防报警设备还包括电源组件及显示屏。电源组件用于对安防报警设备中各模块进行供电,显示屏用于按照处理器提供的数据,进行数据显示。

在本申请实施例中,通过采集音频流实现安防报警,光照因素影响小,能够增加没有光照或者光照不足的情况下安防报警的可靠性。并且通过检测音频流中的目标情绪类型进行报警,相比于检测关键词进行报警的实用性更强,这是因为人在遇到危险时,通常无法正常的进行语音发音,从而导致关键词的识别率大大下降,使得利用关键词进行语音报警的应用变得无效。本申请对语音表达的情绪进行分析,当识别到目标情绪类型(例如恐慌等)时进行报警操作,实际可行性更高。

音频采集组件还可以对音频流进行特征提取等前端处理操作,用于后续的哭声检测与声纹识别等,可选的,上述音频采集组件101还用于:对上述音频流进行语音端点检测,判断上述音频流中是否有语音信息;在上述音频流中有语音信息时,向上述处理器发送上述语音信息;

上述对上述音频流进行分析,确定上述音频流中是否检测到了目标情绪类型,包括:

通过预设算法模型对上述语音信息进行分析,确定上述音频流中是否检测到了目标情绪类型。

工作状态下,音频采集组件101会保持采集环境中的音频流,若将所有的音频流均输入到处理器102中进行目标情绪类型的检测,会造成设备资源的浪费,这是因为音频流中可能存在很多静音片段,即音频流的很多片段中不包含语音信息。音频采集组件101通过vad(voiceactivitydetection,语音端点检测),过滤掉音频流中的静音片段,然后将剩余的语音信息发送给处理器102,触发处理器102对语音信息的目标情绪类型的检测。

在本申请实施例中,通过语音端点检测可以减少处理器的工作负载,节约设备资源,提高设备寿命。

鉴于语音特征需要在时序上进行关联,预设算法模型需要具备时序上特征关联分析的能力,可选的,上述通过预设算法模型对上述语音信息进行分析,确定上述音频流中是否检测到了目标情绪类型,包括:

利用预设算法模型,提取上述语音信息的语音纹理特征,对上述语音信息的语音纹理特征进行分析,得到上述语音信息的语音语义特征,并对上述语音语义特征进行分析,确定上述音频流中是否检测到了目标情绪类型。

例如,预设算法模型可以包括特征提取部分、预设卷积神经网络、预设双向门控循环单元网络及预设全连接神经网络。通过特征提取部分提取上述语音信息的fbank(filterbank,滤波器组)特征;通过预设卷积神经网络对上述fbank特征进行分析,得到语音纹理特征;通过预设双向门控循环单元网络对上述语音纹理特征进行分析,得到语音语义特征;通过预设全连接神经网络对上述语音语义特征进行分析,确定上述音频流中是否检测到了目标情绪类型。

在一种可能的实施方法中,fbank特征具体为80维的fbank特征,预设算法模型具体可以如图2所示,包括2层cnn(convolutionalneuralnetworks,卷积神经网络)及5层bi-gru(bidirectiongatedrecurrentunit,双向门控循环单元)及一层fc(fullyconnectedlayers,全连接层)。另外,为了决绝时序上的对应问题,预设算法模型还可以包括ctc(connectionisttemporalclassification)。

当然预设算法模型也可以采用其他相关的机器学习算法,此处不再赘述。

预设算法模型还可以进行更新,可选的,上述处理器102还用于:通过上述通信组件103从上述服务器下载模型更新数据;利用上述模型更新数据对上述预设算法模型进行更新。

处理器102定期或在获取到用户输出的更新指令后,通过通信组件103向服务器发送更新请求,更新请求中可以包括预设算法模型的标识;服务器按照预设算法模型的标识判断安防报警设备中的算法模型是否需要更新,在需要更新时,服务器向安防报警设备发送模型更新数据。模型更新数据可以为替换的算法模型,也可以升级预设算法模型的必要数据。处理器102通过通信组件103下载模型更新数据,并利用模型更新数据对预设算法模型进行更新。

在本申请实施例中,实现了预设算法模型的更新,能够通过更新预设算法模型提高安防报警设备报警的可靠性。

初始情况下预设算法模型为通用模型,即服务方通过服务方样本训练的算法模型,在一种可能的实施方式中,上述处理器102还用于:通过上述通信组件103向上述服务器发送上述语音信息,以使上述服务器按照上述语音信息生成上述模型更新数据。

处理器102向服务器发送语音信息,服务器利用语音信息对预设算法模型进行训练,实现预设算法模型的更新,服务器保存预设算法模型的模型更新数据。后续处理器102可以通过上述通信组件103从服务器下载该模型更新数据,从而实现安防报警设备中预设算法模型的更新。其中,语音信息的情绪类型标定可以为服务器端实现的,也可以为用户通过安防报警设备实现的。

实际应用场景中,一个服务器会对应多个安防报警设备。可选的,处理器102还用于:向服务器发送注册信息。在注册信息满足预设注册规则时,服务器允许安防报警设备注册。注册信息中可以包括安防报警设备的标识,不同安防报警设备的标识不同,服务器通过安防报警设备的标识区分各安防报警设备。

在本申请实施例中,通过向服务器发送安防报警设备采集的语音信息,实现模型更新数据的生成,后续处理器可以从服务器下载该模型更新数据,从而实现安防报警设备中预设算法模型的更新。针对各安防报警设备,实现了通过安防报警设备实际采集的语音信息进行预设算法模型的更新,预设算法模型更具有针对性,准确定更高,能够增加安防报警的可靠性。

本申请实施例还提供了一种安防报警系统,参见图3,该系统包括安防报警设备301及服务器302;

上述安防报警设备301包括:音频采集组件101、处理器102及通信组件103;上述处理器102分别与上述音频采集组件101及上述通信组件103连接;

上述音频采集组件101用于采集音频流;上述通信组件103用于进行网络通信;上述处理器102用于对上述音频流进行分析,确定上述音频流中是否检测到了目标情绪类型;在上述音频流中检测到了上述目标情绪类型时,通过上述通信组件103向服务器302发送报警信息。

上述服务器302用于:在接收到上述安防报警301设备的报警信息后,按照上述安防报警设备301对应的报警规则进行报警推送。

每个安防报警设备301可以设置不同的报警规则,报警信息中可以包括安防报警设备301的标识,服务器302按照安防报警设备301的标识,确定对应的报警规则,并按照该对应的报警规则进行报警推送。报警规则可以包括:向预览的电话发送短信,向预留的邮箱发送邮件或向当地派出所报警等。

在本申请实施例中,通过采集音频流实现安防报警,光照因素影响小,能够增加没有光照或者光照不足的情况下安防报警的可靠性。并且通过检测音频流中的目标情绪类型进行报警,相比于检测关键词进行报警的实用性更强,这是因为人在遇到危险时,通常无法正常的进行语音发音,从而导致关键词的识别率大大下降,使得利用关键词进行语音报警的应用变得无效。本申请对语音表达的情绪进行分析,当识别到目标情绪类型(例如恐慌等)时进行报警操作,实际可行性更高。

针对本发明实施例的安防报警系统,在一种可能的实施方式中,上述音频采集组件101还用于:对上述音频流进行语音端点检测,判断上述音频流中是否有语音信息;在上述音频流中有语音信息时,向上述处理器发送上述语音信息;

上述对上述音频流进行分析,确定上述音频流中是否检测到了目标情绪类型,包括:

通过预设算法模型对上述语音信息进行分析,确定上述音频流中是否检测到了目标情绪类型。

针对本发明实施例的安防报警系统,在一种可能的实施方式中,可选的,上述通过预设算法模型对上述语音信息进行分析,确定上述音频流中是否检测到了目标情绪类型,包括:

利用预设算法模型,提取上述语音信息的语音纹理特征,对上述语音信息的语音纹理特征进行分析,得到上述语音信息的语音语义特征,并对上述语音语义特征进行分析,确定上述音频流中是否检测到了目标情绪类型。

例如,提取上述语音信息的fbank特征;通过预设卷积神经网络对上述fbank特征进行分析,得到语音纹理特征;通过预设双向门控循环单元网络对上述语音纹理特征进行分析,得到语音语义特征;通过预设全连接神经网络对上述语音语义特征进行分析,确定上述音频流中是否检测到了目标情绪类型。

针对本发明实施例的安防报警系统,在一种可能的实施方式中,上述处理器102还用于:通过上述通信组件103从上述服务器下载模型更新数据;利用上述模型更新数据对上述预设算法模型进行更新。

针对本发明实施例的安防报警系统,在一种可能的实施方式中,上述处理器102还用于:通过上述通信组件103向上述服务器发送上述语音信息。

上述服务器302还用于获取上述安防报警设备301发送的语音信息,按照上述语音信息对上述安防报警设备301对应的预设算法模型进行更新,得到模型更新数据;

上述服务器302还用于在接收到上述安防报警设备301的模型更新请求后,向上述安防报警设备发送上述模型更新数据。

在本申请实施例中,通过向服务器发送安防报警设备采集的语音信息,实现模型更新数据的生成,后续处理器可以从服务器下载该模型更新数据,从而实现安防报警设备中预设算法模型的更新。针对各安防报警设备,实现了通过安防报警设备实际采集的语音信息进行预设算法模型的更新,预设算法模型更具有针对性,准确定更高,能够增加安防报警的可靠性。

可选的,安防报警设备301还可以实现上述实施例中安防报警设备的任一功能。

本申请实施例还提供了一种安防报警方法,参见图4,该方法包括:

s401,获取指定场景中的音频流。

s402,对上述音频流进行分析,确定上述音频流中是否检测到了目标情绪类型。

s403,在上述音频流中检测到了上述目标情绪类型时,发送报警信息。

在本申请实施例中,通过采集音频流实现安防报警,光照因素影响小,能够增加没有光照或者光照不足的情况下安防报警的可靠性。并且通过检测音频流中的目标情绪类型进行报警,相比于检测关键词进行报警的实用性更强,这是因为人在遇到危险时,通常无法正常的进行语音发音,从而导致关键词的识别率大大下降,使得利用关键词进行语音报警的应用变得无效。本申请对语音表达的情绪进行分析,当识别到目标情绪类型(例如恐慌等)时进行报警操作,实际可行性更高。

可选的,上述对上述音频流进行分析,确定上述音频流中是否检测到了目标情绪类型,包括:

步骤一,过滤上述音频流中的静音片段,得到上述音频流的语音信息。

步骤二,提取上述语音信息的语音纹理特征。

提取上述语音信息的fbank特征,通过预设卷积神经网络对上述fbank特征进行分析,得到语音纹理特征。

步骤三,对上述语音信息的语音纹理特征进行分析,得到上述语音信息的语音语义特征。

通过预设双向门控循环单元对上述语音纹理特征进行分析,得到语音语义特征。

步骤四,对上述语音语义特征进行分析,确定上述音频流中是否检测到了目标情绪类型。

通过预设全连接层对上述语音语义特征进行分析,确定上述音频流中是否检测到了目标情绪类型。

可选的,本申请实施例的安防报警方法还包括:从上述服务器下载模型更新数据;利用上述模型更新数据对上述预设算法模型进行更新。

可选的,本申请实施例的安防报警方法还包括:通过向上述服务器发送上述语音信息,以使上述服务器按照上述语音信息生成上述模型更新数据。

在一种可能的实施方式中,安防报警方法具体可以如图5所示,包括:

步骤a,获取应用场景中的音频流。

步骤b,对音频流进行vad检测,判断是否有语音信息,若有语音信息则执行步骤c,若没有语音信息则返回步骤a执行。

步骤c,通过预设算法模型对语音信息进行分析,判断语音信息中是否检测出目标情绪类型,若有目标情绪类型执行步骤d,若没有目标情绪类型则返回步骤a执行。

步骤d,向服务器报警。

在本申请实施例中,通过采集音频流实现安防报警,光照因素影响小,能够增加没有光照或者光照不足的情况下安防报警的可靠性。并且通过检测音频流中的目标情绪类型进行报警,相比于检测关键词进行报警的实用性更强,这是因为人在遇到危险时,通常无法正常的进行语音发音,从而导致关键词的识别率大大下降,使得利用关键词进行语音报警的应用变得无效。本申请对语音表达的情绪进行分析,当识别到目标情绪类型(例如恐慌等)时进行报警操作,实际可行性更高。

本申请实施例还提供了一种安防报警装置,参见图6,该装置包括:

音频采集模块601,用于获取指定场景中的音频流;

情绪识别模块602,用于对上述音频流进行分析,确定上述音频流中是否检测到了目标情绪类型;

报警关联模块603,用于在上述音频流中检测到了上述目标情绪类型时,发送报警信息。

可选的,上述情绪识别模块602,包括:

静音片段过滤子模块,用于过滤上述音频流中的静音片段,得到上述音频流的语音信息。

纹理特征提取子模块,用于提取所述语音信息的语音纹理特征。

语义特征提取子模块,用于对所述语音信息的语音纹理特征进行分析,得到所述语音信息的语音语义特征。

情绪类型确定子模块,用于对所述语音语义特征进行分析,确定所述音频流中是否检测到了目标情绪类型。

在一种可能的实施方式中,上述纹理特征提取子模块,具体用于提取上述语音信息的fbank特征,通过预设卷积神经网络对上述fbank特征进行分析,得到语音纹理特征。

上述语义特征提取子模块,具体用于通过预设双向门控循环单元对上述语音纹理特征进行分析,得到语音语义特征。

上述情绪类型确定子模块,具体用于通过预设全连接层对上述语音语义特征进行分析,确定上述音频流中是否检测到了目标情绪类型。

可选的,本申请实施例的安防报警装置还包括:

算法模型更新模块,用于从上述服务器下载模型更新数据;利用上述模型更新数据对上述预设算法模型进行更新。

可选的,本申请实施例的安防报警装置还包括:

样本数据上传模块,用于通过向上述服务器发送上述语音信息,以使上述服务器按照上述语音信息生成上述模型更新数据。

上述设备提到的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本申请实施例还提供了一种计算机可读存储介质,上述计算机可读存储介质内存储有计算机程序,上述计算机程序被处理器执行时实现上述任一安防报警方法。

需要说明的是,在本文中,各个可选方案中的技术特征只要不矛盾均可组合来形成方案,这些方案均在本申请公开的范围内。诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

相关标签: 通信语义分析安防
tips