一种基于飞机音频的机型智能识别方法与流程
本发明涉及目标识别领域,特别涉及一种通过飞机音频识别机型的智能方法。
背景技术:
随着航空技术的发展,飞机的种类和数量越来越多,飞行速度也越来越快。因此,情报侦察系统需要处理的信息量大大增加,信息处理的速度和精度也越来越高,从而对目标识别的精度和处理时间提出了更高的要求。飞机类型识别是现代化空战的重中之重。精确的飞机型号识别在指挥自动化系统的后期信息处理中起着至关重要的作用,有利于准确分析战场态势,从而提供更合理的战场决策。
目前机型识别主要依靠人工经验,耗费了大量的人力物力,智能识别尚处于研究阶段,现有的智能识别方法主要基于图像完成。然而图像识别机型有一定的局限性,如在拍摄过程中存在着成像分辨率、运动模糊和自然因素的影响,使得基于图像的智能机型识别不能达到战场需求。基于飞机音频特征的机型识别能够有效解决图像识别存在的问题。
申请号为cn201911264985.8的公开发明专利公开了“一种飞机机型识别方法、装置及存储介质”,通过探测设备得到飞机视频信息,提取待识别飞机样本图片,通过二分类器模型识别飞机型号,此方法使用视频识别机型,具有一定的局限性。专利号为cn201410377473.3的公开发明专利公开了“一种基于视觉图像的飞机机型识别方法”,使用帧差法提取目标轮廓信息,计算飞机各部位的长度比值,此方法使用图片识别机型,不仅具有局限性而且在飞机飞行姿势不同时,识别精度会下降。
技术实现要素:
(一)发明目的
本发明的目的是提供通过一种基于飞机音频的机型智能识别方法。本发明飞机机型识别精确度高,并能克服飞机运动模糊、成像分辨率和自然因素带来的影响,适用于实际工程项目。
(二)技术方案
本发明的技术解决方案,一种基于飞机音频的机型智能识别方法,其特征在于,包括:采集不同型号飞机的音频,将音频进行预处理,提取音频的梅尔倒谱系数特征,训练残差自注意力模型;将目标飞机音频信号输入到训练好的模型中,得到目标飞机的型号,该方法的由如下步骤构成。
采集不同型号飞机的音频,飞机起飞降落时,通过机场噪音监测系统采集不同型号飞机的噪声;飞机空中飞行时,通过安装在飞机录音设备采集与飞机起飞降落时相同机型飞机的噪声;通过不同方法采集的飞机音频可以提高识别模型的鲁棒性;
飞机音频的预处理,飞机空中飞行时的噪声可能存在人声,剔除人声部分;同一机型的飞机记录标签,将所有音频切割为5s的音频片段;对不同类型的飞机音频进行等数量随机选取,并按照7:2:1的比例随机分为训练集,验证集和测试集;
提取音频的梅尔倒谱系数特征,将音频信号频率转化为梅尔频率:
其中fmel是梅尔频率,f是音频信号频率;梅尔频率取对数得到对数梅尔声谱,进行离散余弦变化,保留第2个到第13个系数,得到12维的梅尔倒谱系数特征;
训练残差自注意力模型,将梅尔倒谱系数特征输入至嵌入层进行降维,位置编码器对特征进行位置编码得到特征x1,特征x1与三个权重矩阵相乘得到q,k,v:
wq、wk、wv分别由由查询向量q(query)、键向量k(key)、值向量v(value)组成的权重矩阵;计算自注意力值:
得到特征x2,与特征x1特征相加得到特征x,使用残差网络结构可以减轻网络的退化程度;将特征x输入到池化层,减少网络参数,防止过拟合;最后通过全连接层,得到识别模型,全连接层中神经元的个数等于飞机型号类别总数;
将飞机训练集和验证集输入到残差自注意力模型中,网络学习率learning_rate设置为0.0001,选用交叉熵损失函数,利用梯度下降法迭代训练网络,直至损失函数收敛,得到基于飞机音频的机型智能识别模型;
识别目标机型,将飞机音频的测试集,提取梅尔倒谱系数特征,将特征输入到机型智能识别模型中,得到目标机型的识别结果,并通过与正确标签对比,计算型智能识别模型的精确度。
本发明实现了基于飞机音频的机型智能识别。本发明可以克服飞机运动模糊、成像分辨率和自然因素带来的影响,高精度识别多种机型的型号。
(三)有益效果
本发明的上述技术方案具有如下有益的技术效果:本发明被用来识别飞机的型号,可以克服飞机运动模糊、成像分辨率和自然因素带来的影响,实验结果如图4所示,其机型识别结果达到98.7%,结果证明了一种基于飞机音频的机型智能识别方法可以应用于飞机机型识别。
附图说明
图1是本发明的流程框架图;
图2是本发明实施例识别模型训练时的精确度函数图;
图3是本发明实施例识别模型训练时的损失函数图;
图4是本发明实施例基于飞机音频的飞机型号识别结果混淆图。
具体实施方式
为使本发明的技术方案、优点和目的更加清楚明了,结合具体实例说明了方法流程并参照附图,对本发明的技术方案进一步说明。
本发明实施例1,一种基于飞机音频的机型智能识别方法,参见图1,按下述步骤进行:
采集9种不同型号飞机的音频,型号分别是:a330、a340、a350、a350、a380、b737、b747、b757、b777。飞机起飞降落时,通过机场噪音监测系统采集这9种型号飞机的噪声;飞机空中飞行时,通过安装在飞机录音设备采集与飞机起飞降落时相同机型飞机的噪声。
飞机音频的预处理,飞机空中飞行时的噪声可能存在人声,剔除人声部分;同一机型的飞机记录标签,将所有音频切割为5s的音频片段,共计9900条音频样本;对不同类型的飞机音频进行等数量随机选取,并按照7:2:1的比例随机分为训练集,验证集和测试集;
提取音频的梅尔倒谱系数特征,将音频信号频率转化为梅尔频率:
其中fmel是梅尔频率,f是音频信号频率;梅尔频率取对数得到对数梅尔声谱,进行离散余弦变化,保留第2个到第13个系数,得到12维的梅尔倒谱系数特征;
训练残差自注意力模型,将梅尔倒谱系数特征输入至嵌入层进行降维,位置编码器对特征进行位置编码得到特征x1,特征x1与三个权重矩阵相乘得到q,k,v:
wq、wk、wv分别由由查询向量q(query)、键向量k(key)、值向量v(value)组成的权重矩阵;计算自注意力值:
得到特征x2,与特征x1特征相加得到特征x,使用残差网络结构可以减轻网络的退化程度;将特征x输入至池化层,减少网络参数,防止过拟合;最后通过全连接层,得到识别模型,全连接层中神经元的个数等于飞机型号类别总数,此处设置为9;
将飞机训练集和验证集输入到残差自注意力模型中,网络学习率learning_rate设置为0.0001,选用交叉熵损失函数,利用梯度下降法迭代训练网络,迭代50次,得到基于飞机音频的机型智能识别模型;在训练过程中,测试集和验证集的训练过程如图2和图3所示,损失函数变化如图2所示,精确度变化如图3所示。
识别目标机型,将飞机音频的测试集,提取梅尔倒谱系数特征,将特征输入到机型智能识别模型中,得到目标机型的识别结果,并通过与正确标签对比,其识别正确率到达98.7%;其结果如图4所示,横坐标表示模型识别型号,纵坐标表示飞机真实型号。
本发明说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。
此文章来源于网络,如有侵权,请联系删除