HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

一种基于接触网支柱杆号图像识别的列车定位方法与流程

2021-02-05 09:02:54|390|起点商标网
一种基于接触网支柱杆号图像识别的列车定位方法与流程

本发明属于列车定位的技术领域,具体涉及一种基于接触网支柱杆号图像识别的列车定位方法。



背景技术:

列车定位是列车监控和控制系统中的重要组成部分,对确保列车能够稳定运行具有重要的意义。但是随着列车控制系统对列车定位性能的要求不断增加,目前使用的定位方法以及定位设备都存在一定的缺点。

对于在隧道中以及地下运营的列车来说,传统的gps定位技术将受到信号遮挡而定位精度严重下降甚至无法发挥作用;目前常用的应答-查询器的定位方法的信息传递的间隔较大,并且还要安放大量的传感器,不易后期对传感器进行维护和更换;基于里程计的定位方法直接受到车轮的影响产生误差,且误差会随列车的运行里程的增加而逐渐增大;基于轨道电路和轨旁设备的列车定位所存在的比较大的缺陷为需要较高的成本以及定期的维护。



技术实现要素:

本发明的目的在于针对现有技术中的上述不足,提供一种基于接触网支柱杆号图像识别的列车定位方法,以解决现有的列车定位方法中存在着的在gps信号缺失时无法定位、定位间隔大、定位误差较大、建设和维护成本高、定位精度随列车的运营变得不稳定的的问题。

为达到上述目的,本发明采取的技术方案是:

一种基于接触网支柱杆号图像识别的列车定位方法,其包括:

s1、利用接触网悬挂状态检测装置实时获取接触网设备的高清视频,对接触网中接触悬挂、附加悬挂、支撑装置和定位装置进行清晰成像;

s2、提取巡检视频中的关键帧,获取包含完整沿途所有接触网支柱的高清图像;

s3、对高清图像进行预处理,确定接触网支柱区域;

s4、采用hog特征描述法和svm分类对图像中接触网支柱的杆号的矩形区域进行定位,并将进行灰度变换后的图像进行二值化处理;

s5、基于水平投影法对二值化后的支柱杆号矩形区域进行切割,将字符分割开;

s6、对字符素材归一化,并对原始图像进行缩放;

s7、采用lenet-5卷积神经网络对归一化后的字符直接进行图像识别;

s8、将获取的支柱杆号与基础台账库进行比对,得到对应支柱杆号的定位信息,并获得列车的实时位置。

优选地,s2中提取巡检视频中的关键帧,获取包含完整沿途所有接触网支柱的高清图像,包括:

根据4c检测装置使用的高速工业相机的采样频率和列车运行车速,提取含有接触网支柱的高清图片;

定义f为高速工业相机的采样频率,v为列车实时运行速度,l为标准接触网支柱间隔,考虑列车运行速度为离散量,则:

计算跨越相邻支柱时间间隔δti为:

计算列车行驶经过相邻支柱实时采集的高清图像数量ni为:

ni=δti·f

从ni张高清照片中等距选取5张高清照片,定义nj为选中的5张图像的编号,则:

nj={0.2ni,0.4ni,0.6ni,0.8ni,ni}

若nj的计算值非整数时,则自动向上取整。

优选地,s3中对高清图像进行预处理,确定接触网支柱区域,包括:

s3.1、采用灰色变换,将4c转置采集的彩色图片转化为灰度图:

g(x,y)=0.299r(x,y)+0.587g(x,y)+0.114b(x,y)

其中,r(x,y)为红色分量;g(x,y)为绿色分量;b(x,y)为蓝色分量;g(x,y)为灰色图像,x和y分别为所变换像素点位置的横纵坐标;

s3.2、采用亮度校正和消除动态模糊对灰度图进行图像增强;

s3.3、基于拉普拉斯高斯算法对立柱边缘轮廓进行加强,并根据图像强度二阶导数的过零点确定边缘位置:

其中,f(x,y)为具有整数像素坐标的输入图像,表示对函数进行求一阶导数,为拉普拉斯高斯算子,其表达式为:

其中,σ为高斯函数方差;

s3.4、采用hough变换进行直线检测,对立柱区域进行定位,即将图像空间中共线的点映射到参数空间,利用局部峰值检测出直线参数后映射回图像空间,得到图像直线检测结果,包括:

采用极坐标描述直线将图像空间中的点(x,y)映射到ρ-θ参数空间:

ρ=xcosθ+ysinθ

设被检测的直线在第一象限,经过点(m,n),由直线极坐标方程可得ρ和θ的取值范围:

其中,θ的取值范围为0°~180°;

当且仅当x和y都达到最大且时,ρ的取值范围为

优选地,s4中采用hog特征提取和svm分类器算法对立柱杆号的所在矩形区域进行特征提取,并将进行灰度变换后的图像进行二值化处理,包括:

s4.1、hog特征提取:

i(x,y)=i(x,y)gamma

其中,i(x,y)为图像(x,y)位置处的像素值,gamma表示压缩系数;在图像的(x,y)位置,计算图像的水平方向的梯度g1x与垂直方向的梯度g1y,并得到每个像素位置的梯度方向值:

g1x(x,y)=i(x+1,y)-i(x,y)

g1y(x,y)=i(x,y+1)-i(x,y)

像素点(x,y)处的梯度幅值g(x,y)和梯度方向α(x,y)分别为:

划分单元格和区域,将图像分成多个单元格,给每个单元格构建梯度方向直方图,把多个单元组成的区域内归一化梯度直方图,收集hog特征;

s4.2、二值化提取,将图像上的像素点的灰度值设置为0或255,选取阈值对灰度图像进行二值化:

其中,tresh为设置阈值。

优选地,tresh阈值选取为100。

优选地,s6中对字符素材归一化,并对原始图像进行缩放,包括:

在所需插值像素点位置选取周围16个像素点,对选取的16个像素点分别进行水平与垂直方向的三阶插值计算,并将所得结果赋值给所需插值像素点,其插值函数h(x)为:

插值函数从上到下分别对应的取值范围为:[0,1);[1,2);其他。

使用双3次插值算法将所有机车车号字符大小都归一化为3大小的字符素材。

优选地,s7中采用lenet-5卷积神经网络对归一化后的字符直接进行图像识别,包括:

输入32×32图像,将32×32图像通过6个可训练的卷积核进行卷积运算,在c1层产生6个28×28的特征响应图;

每个特征响应图通过池化运算后,在s2层产生6个14×14的特征响应图;

通过16个可训练的卷积核进行卷积运算得到包含16个特征响应图的c3层;

通过池化运算,在s4层产生包含有16个5×5的特征向量图;

将s4层的所有特征响应图向量化,输入到全连接神经网络,输出120个神经元;

经过两个全连接层,到达输出层,输出层具有10个神经元,每一个神经元代表一个阿拉伯数字;并通过得到的一个长度为10的行矩阵,进而获取支柱杆号。

本发明提供的基于接触网支柱杆号图像识别的列车定位方法,具有以下有益效果:

本发明利用列车接触网悬挂状态检测装置对列车左右两侧的接触网支柱杆号的识别来进行定位,成本低,简单方便,受列车运行环境的影响小;同时,本发明可有效解决现有列车定位方法中存在gps信号缺失时无法定位、定位间隔大、定位误差较大、建设和维护成本高、定位精度随列车的运营变得不稳定的技术问题,本发明可高效率低成本地对列车进行实时定位,并且具有高的精度和稳定性。

附图说明

图1是本发明实施例中使用的改进的lenet-5网络结构图。

图2是本发明基于接触网支柱杆号图像识别的列车定位方法流程图。

具体实施方式

下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

根据本申请的一个实施例,参考图1和图2,本方案的基于接触网支柱杆号图像识别的列车定位方法,包括:

s1、利用接触网悬挂状态检测装置实时获取接触网设备的高清视频,对接触网中接触悬挂、附加悬挂、支撑装置和定位装置进行清晰成像;

s2、提取巡检视频中的关键帧,获取包含完整沿途所有接触网支柱的高清图像;

s3、对高清图像进行预处理,确定接触网支柱区域;

s4、采用hog特征描述法和svm分类对图像中接触网支柱的杆号的矩形区域进行定位,并将进行灰度变换后的图像进行二值化处理;

s5、基于水平投影法对二值化后的支柱杆号矩形区域进行切割,将字符分割开;

s6、对字符素材归一化,并对原始图像进行缩放;

s7、采用lenet-5卷积神经网络对归一化后的字符直接进行图像识别;

s8、将获取的支柱杆号与基础台账库进行比对,得到对应支柱杆号的定位信息,并获得列车的实时位置。

本发明基于lenet-5卷积神经网络,对列车当前位置铁路接触网支柱杆号进行图像识别,系统自动对照基础台账(记录各支柱精确位置的数据库)精准定位列车当前位置。本发明利用接触网悬挂状态检测装置(4c)对接触网设备进行高清成像,接着对提取图像进行预处理,即先对原始彩色图像进行灰度化,并利用hog特征描述法和svm分类实现对于图像中接触网支柱的杆号的矩形区域进行定位,接着利用水平投影法对杆号进行字符分割并对字符特征信息进行提取,最后采用lenet-5卷积神经网络对归一化后的切割字符进行识别,确定对应接触网支柱的杆号,精确定位当前列车行驶位置。

根据本申请的一个实施例,以下将对上述步骤进行详细描述。

步骤s1、利用接触网悬挂状态检测装置(4c)实时获取接触网设备的高清视频,对接触网中接触悬挂、附加悬挂、支撑装置、定位装置及其他区域进行清晰成像。

步骤s2、由于4c检测装置获取视频图像过大,逐帧处理难度对于主机性能要求过高,仅需提取巡检视频中的关键帧以降低识别时间,提高识别效率。关键帧需获取包含完整沿途所有接触网支柱的清晰图像,其具体步骤包括:

考虑4c检测装置使用的高速工业相机的采样频率和列车运行车速,精确提取含有接触网支柱的高清图片。

假设f表示高速工业相机的采样频率,v为列车实时运行速度,l为标准接触网支柱间隔,若忽略其他影响因素,并考虑列车运行速度为离散量,则:

跨越相邻支柱时间间隔为:

列车行驶经过相邻支柱实时采集的高清图像数量为:

ni=δti·f

从ni张高清照片中等距选取5张高清照片,假设nj为选中的5张图像的编号,表示如下:

nj={0.2ni,0.4ni,0.6ni,0.8ni,ni}

若nj的计算值非整数时,系统自动向上取整;通过对相邻支柱间图像均匀5次取样,在保证能获取最佳检测视角的高清接触网支柱图像的同时,大幅节约检测识别过程时间。

步骤s3、高清图像预处理,确定接触网支柱区域,用于提高下一步处理精度和速率,其具体步骤包括:

步骤s3.1、采用灰色变换,将4c转置采集的彩色图片转化为灰度图,用于过滤无关信息,包括:

利用灰度变化的公式对彩色图片进行处理:

g(x,y)=0.299r(x,y)+0.587g(x,y)+0.114b(x,y)

其中,r(x,y)为红色分量;g(x,y)为绿色分量;b(x,y)为蓝色分量;g(x,y)为灰色图像。

步骤s3.2、利用亮度校正和消除动态模糊对灰度图进行图像增强,在4c巡检图像信号的采集、输入等过程中由于电信号的干扰会使得图像质量的下降,同时由于图像拍摄时环境因素的影响,使得拍摄图像出现一定的失真和变形,导致后续识别分类出现偏差。

利用亮度校正对灰度图像中较暗部分进行增亮处理,去除噪声并强调边缘的特征。

步骤s3.3、利用拉普拉斯高斯算法对立柱边缘轮廓进行加强,方便立柱的区域的提取。

算法中涉及到的log检测边缘算子利用图像强度二阶导数的过零点确定边缘位置,其对于噪声非常敏感,需通过图像增强消除干扰,其算法为:

其中,表示拉普拉斯高斯算子,它的公式为:

拉普拉斯高斯算法效果在边缘检测算子中效果最好,算法稳定准确,有助于提升定位精度。

步骤s3.4、采用hough变换实现直线检测,对立柱区域进行定位,其基本原理是将图像空间中共线的点映射到参数空间,利用局部峰值检测出直线参数后映射回图像空间,得到图像直线检测结果,其具体包括:

采用极坐标描述直线将图像空间中的点(x,y)映射到ρ-θ参数空间。

ρ=xcosθ+ysinθ

设被检测的直线在第一象限,经过点(m,n),由直线极坐标方程可得ρ和θ的取值范围:

其中,θ的取值范围为0°~180°。

当且仅当x和y都达到最大且时,ρ的取值范围为

检测直线的具体过程就是让θ取遍所有可能的值,然后计算ρ的值,再根据θ和ρ的值对累加数组累加,从而得到共线点的个数。设置一个合适的阈值,共线点的个数大于这个阈值就是所需的直线,即接触网支柱的两条边缘直线。

步骤s4、对于处理好的支柱区域图像,采用hog特征提取和svm分类器算法实现对立柱杆号的所在矩形区域提取,并图像进行灰度变换后进行二值化处理,其中hog特征和二值化提取原理如下:

步骤s4.1、hog特征提取:

i(x,y)=i(x,y)gamma

其中,i(x,y)为图像(x,y)位置处的像素值,gamma表示压缩系数,通常取值为0.5。在图像的(x,y)位置,计算图像的水平方向的梯度g1x与垂直方向的梯度g1y,并据此得出每个像素位置的梯度方向值。

g1x(x,y)=i(x+1,y)-i(x,y)

g1y(x,y)=i(x,y+1)-i(x,y)

像素点(x,y)处的梯度幅值g(x,y)和梯度方向α(x,y)分别为:

划分单元格和区域,将图像分成多个单元格,给每个单元格构建梯度方向直方图,把多个单元组成的区域内归一化梯度直方图,然后收集hog特征。

步骤s4.2、二值化提取原理:

二值化就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果的过程;二值化使图像中数据量大为减少,从而能凸显出目标的轮廓。

选取合适的阈值对灰度图像进行二值化,公式如下:

其中,tresh为设置阈值,一般选取100。

步骤s5、利用水平投影法对二值化后的支柱杆号矩形区域进行切割,将字符分割开;该字符切割方法运算速度快,精度较高,能满足对列车实时位置进行快速识别的要求。

步骤s6、字符素材归一化,后续步骤采用的卷积神经网络输入为32×32的图像素材,需要对原始图像进行缩放。其思想是在所需插值像素点位置选取周围16个像素点,对选取的16个像素点分别进行水平与垂直方向的三阶插值操作,并将所得结果赋值给所需插值像素点,插值函数的表达式如下:

插值函数从上到下分别对应的取值范围为:[0,1);[1,2);其他。

使用双3次插值算法将所有机车车号字符大小都归一化为32×32大小的字符素材,以便可以使用lenet-5算法进行分类识别。

步骤s7、鉴于我国采用的接触网支柱杆号仅含有数字,归一化后的字符直接采用lenet-5卷积神经网络进行图像识别。由迁移学习的思想,对已经预训练好的网络模型直接进行模型迁移,原理如下:

卷积神经网络主要由卷积层与池化层两部分组成,其中,卷积层的数学函数表达式为:

其中,1是层数;是特征响应图;为卷积核心;nl-1为l-1层特征图的个数;conv(x,y)为对x,y进行卷积操作。

池化层是对输入的上一层特征图素材进行抽样操作,保证抽样后的特征图像大小改变为原来的1/2,函数表达式为:

接着对lenet-5神经网络为:

卷积神经网络lenet-5算法是一个多层的神经网络,对于二维图像的特征提取有着出色的表现。lenet-5网络模型结构主要由7层组成,每一层都包括可以训练的参数。

该网络的输入是32×32的图像,其中,c层是由卷积层神经元组成的网络层,s层是由池化层组成的网络层。

步骤s7.1、输入图像后,经过6个可训练的卷积核进行卷积操作,在c1层产生6个28×28的特征响应图;

步骤s7.2、每个特征响应图经过池化操作后,s2层产生6个14×14的特征响应图;

步骤s7.3、经过16个可训练的卷积核进行卷积操作得到具有16个特征响应图的c3层;

步骤s7.4、经过池化操作,s4层产生具有16个5×5的特征向量图;

步骤s7.5、将s4层的所有特征响应图向量化,输入到全连接神经网络,输出120个神经元;

步骤s7.6、经过两个全连接层,到达输出层,输出层具有10个神经元,每一个神经元代表一个阿拉伯数字。通过得到的一个长度为10的行矩阵,最终对应接触网支柱的杆号数字。

步骤s8、将获取的支柱杆号与现有基础台账库进行比对,得到对应支柱杆号的精确定位信息,最终获得列车的实时位置,最终准确定位列车。

本发明利用列车接触网悬挂状态检测装置对列车左右两侧的接触网支柱杆号的识别来进行定位,成本低,简单方便,受列车运行环境的影响小;同时,本发明可有效解决现有列车定位方法中存在gps信号缺失时无法定位、定位间隔大、定位误差较大、建设和维护成本高、定位精度随列车的运营变得不稳定的技术问题,本发明可高效率低成本地对列车进行实时定位,并且具有高的精度和稳定性。

虽然结合附图对发明的具体实施方式进行了详细地描述,但不应理解为对本专利的保护范围的限定。在权利要求书所描述的范围内,本领域技术人员不经创造性劳动即可做出的各种修改和变形仍属本专利的保护范围。

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

tips