CN115937761A 审中 一种基于图像识别的地铁防淹门状态监测方法
技术领域 [0001]本发明涉及图像识别领域,具体涉及一种基于图像识别的地铁防淹门状态监测方法。 背景技术 [0002]由于地铁系统具有高时效、高运量的特色,各国主要城市将地铁网作为公共交通出行和运输的骨干网络,是大多数通勤族的首选。而地铁系统主要是在地下开凿隧道以构成轨道路网,但构建路网时并无法使隧道完全避开如断层带、过河段、出土段或路网交会处等可能的涌水点,加上近年来气候渐趋极端,出现暴雨并酿成洪灾的机率相对提高,会对乘坐地铁出行的人员造成人身安全威胁和财产损失。为了避免这一灾难,一些城市地铁线路采用升降式防淹门、液压摆臂式防淹门等,都是为了避免暴雨天气地铁被淹以及造成不必要的人员伤害与财产损失。 [0003]由上述可知,升降式防淹门在现代化地铁系统具有重要性和必要性,其防灾减灾作用明显,但如何在高可靠度、高安全性及高时效性等条件下控制防淹门的启闭,亟需设计更加科学和智能的方法。 [0004]在无法精确预知灾害发生时机的状况下,地铁系统在营运时间内,其隧道中当然维持着列车的正常运行,而一旦关闭防水闸门后即将整段的隧道完全封闭。尽管灾害防制措施必须及时且有效地执行,但必须在灾害状况被有效确认后为之,以避免误触或恶意启动之情况发生,因而升降式防淹门的闸门控制必须避免发生过犹不及的状况,始终能确保系统的稳定性与可靠度,如果需要满足此要求,可以采用深度学习等智能学习算法和模型。升降式防淹门状态检测与深度学习相结合来防治灾害,可以大大提高检测效率,通过自动化手段控制防淹门的启动,节省大量的人力物力资源。 发明内容 [0005]有鉴于此,本发明的目的是提供一种基于图像识别的地铁防淹门的状态监测方法。用于克服现有技术中存在的升降式防淹门闸门控制的种种弊端。 [0006]本发明的目的是通过以下技术方案实现的: [0007]一种基于图像识别的地铁防淹门状态监测方法,所述方法包括: [0008]S1、对地铁防淹门的状态图进行采集,并将多张地铁防淹门原始图像进行预处理,形成深度神经网络图像分类模型,并对该模型进行训练; [0009]S2、将该模型用于防淹门现场所获得的实时现场图像的识别中,一旦发现防淹门所在处的水位出现异常情况,则发出预警信号并采取进一步的避险措施。 [0010]S3、采用本发明提出的ResLNet网络进行地铁升降式防淹门状态图像的识别分类; [0011]S4、基于迁移学习的场景,在大规模数据集ImageNet上进行模型训练,并将其迁移到地图防淹门图像数据集,实现地图防淹门状态的准确识别分类,具体模型参见图4[0012]S5、为提升模型的分类准确率,对采集到的升降式防淹门状态图像采用数据增强技术进行数据增强,获得丰富的训练样本用于模型训练,提升模型的鲁棒性和泛化能力。 [0013]S501、所述数据增强技术包括比例缩放、水平/垂直翻转和图像随机裁剪。 [0014]S502、在进行模型训练以及防淹门现场所获得的实时现场图像的处理中,通过OpenCV库处理多张防淹门图像,并实现特征提取。 [0015]S6、通过OpenCV处理的步骤如下: [0016]S601、在OpenCV中利用resize(·)函数重新设置大小,统一输入地铁升降式防淹门图像大小; [0017]S602、retval=img[y:y+h,x:x+w].copy()函数对输入的地铁升降式防淹门图像进行随机裁剪,作为一种选择,可以设置裁剪的大小为330,将输入的图随机裁剪为330*330(超低分辨率,占用空间小)的图像,其中x,y为像素值,是地铁升降式防淹门图像裁剪矩形区域的坐标值,w,h为像素值,是地铁升降式防淹门图像裁剪矩形区域的宽度、高度; [0018]S603、利用im1=opcv.flip(im,1)和im2=opcv.flip(im,0)函数对随机裁剪后的地铁升降式防淹门图像分别依照默认的旋转概率进行水平/垂直翻转,其中opcv表示图像识别方法库,im为地铁升降式防淹门图像,0表示绕X轴翻转,1表示绕Y轴翻转; [0019]S604、利用opcv.getRotationMatrix2D和opcv.warpAffine对翻转后的地铁升降式防淹门图像进行随机旋转,根据旋转角度和位移来计算放射矩阵,返回放射矩阵,作为后续warpAffine操作的输入。例如:传入参数是15度,就沿x轴正方向逆时针旋转45度,目的是让最终得到的图像不会丢失任何信息,具体参见实施例三; [0020]S605、利用normalize(·)函数对旋转变换后的地铁升降式防淹门图像进行归一化处理,使模型训练时梯度对每张图片的作用都是平均的; [0021]S606、利用ResLNet网络实现特征提取,在图像分类数据集上进行预训练得到ResLNet的网络结构和参数。 [0022]S7、在图像识别时,基于迁移学习的场景,通过优化损失函数、分类器函数拟合监控的防淹门图像样本,分析图像并识别防淹门状态。 [0023]S8、将经过特征提取之后的向量x分割成了N个低维嵌入xi(i∈[1,N]),通过模型对低维表示进行变换,分别与相应的权重进行点积运算得到(wi·xi),将全部低维向量聚合得 [0024] [0025]S9、ResLNet网络利用聚合变换的思想,采用一个更通用的函数代替初等变换(wi·xi),聚合转换可以表示为: [0026] [0027]其中,Z(xi)是任意函数,Z(xi)将x投影到一个嵌入表示中,然后进行转换;J表示要聚合的转换集的数量; [0028]最后将上述聚合转换F(x)用作残差函数,得到: [0029] [0030]其中,y为输出特征。 [0031]S10、利用多分类支持向量机对输出特征y进行分类; [0032]定义损失函数C,用来衡量对预估结果的不满意程度;当评分函数输出结果与真实结果之间差异越大,损失函数越大,反之越小;每个样本损失函数求和取平均。 [0033]Ci为第i条数据样本的多类SVM的损失函数: [0034] [0035]对于有N个训练样本对应N个标签的训练集数据,损失函数定义为: [0036] [0037]其中,Ci为第i条数据样本的多类SVM的损失函数,ki表示正确分类的标签,表示在正确分类标签上的评分,rq表示在不正确分类标签上的评分,N为样本个数;通过优化损失函数,SVM分类器函数将图像样本拟合,使得大部分样本输出的结果符合目标函数大于0;图像离超平面越远,评分绝对值越大,表示分类正确。 [0038]S11、所述地铁防淹门的控制线路及防淹门图像采集装置与设于地铁站内的近端监控系统连接,所述近端监控系统与设置在站外的远端监控中心连接,所述远端监控中心还与地铁控制中心的号志系统连接,并执行基于迁移学习技术的地铁防淹门状态检测图像识别的算法。 [0039]S12、所述远端监控中心识别到任一地铁站的现场图像出现水位异常时,立即通报地铁控制中心的号志系统,在确定隧道净空后,以遥控方式关闭升降式防淹门;当远端遥控无法正常执行时,则授权近端监控台执行近端遥控关闭作业。 [0040]本发明的有益效果是: [0041](1)本发明将图像识别技术与地铁防淹门的预防机制相结合,当识别到升降式防淹门存在异常状态时,立刻采取相应的防护措施阻止风险扩大,实现地铁防淹门的智能化控制,有效提升了防淹门使用过程中的安全性和及时性。 [0042](2)本发明提出ResLNet深度学习网络区别于传统的ResNet网络,模型的参数更少,可以在不增加计算代价的前提下,提高图像识别的准确率。此外,ResLNet网络结构更简单,更具通用性。 [0043](3)本发明考虑到地铁防淹门状态识别的特殊性,对应设计适合的图像识别模型对实时图像进行高效率、高准确性的识别作业,同时通过数据增强的方法,如比例缩放、水平/垂直翻转和图像随机裁剪等技术,降低了图像成像的要求,进一步提高了模型的鲁棒性和泛化能力。 [0044](4)本发明采用了多层控制方式,地铁防淹门的控制线路及防淹门图像采集装置与设于地铁站内的近端监控系统连接,近端监控系统与设置在站外的远端监控中心连接,远端监控中心还与地铁控制中心的号志系统连接,可实现远程实时控制。 [0045]本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书和前述的权利要求书来实现和获得。 附图说明 [0046]为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,其中: [0047]图1为本发明的方法流程示意图; [0048]图2为原始地铁防淹门图像; [0049]图3为SVM多分类器示意图; [0050]图4为基于迁移学习的图像分类模型; [0051]图5为基于迁移学习技术的地铁防淹门图像检测模型; [0052]图6为地铁防淹门图像识别准确率结果对比。 具体实施方式 [0053]以下将参照附图,对本发明的优选实施例进行详细的描述。应当理解,优选实施例仅为了说明本发明,而不是为了限制本发明的保护范围。 [0054]实施例一 [0055]图1所示,本发明的一种基于图像识别的地铁防淹门状态监测方法,主要包括: [0056]一、模型的建立和训练:对地铁防淹门的状态图进行采集,并将大量地铁防淹门原始图像预处理,形成深度神经网络图像分类模型,并对该模型进行训练; [0057]二、将模型应用于现场图像的识别并对异常情况报警:将该模型用于防淹门现场所获得的实时现场图像的识别中,一旦发现防淹门所在处的水位出现异常情况,则发出预警信号并采取进一步的避险措施。 [0058]其中,在对图像的处理和识别中,本实施例用了ResLNet网络进行地铁升降式防淹门状态图像的识别分类;基于迁移学习的场景,在大规模数据集ImageNet上进行模型训练,并将其迁移到地图防淹门图像数据集,实现地图防淹门状态的准确识别分类;为进一步提升模型的分类准确率,对采集到的升降式防淹门状态图像采用数据增强技术进行数据增强,获得丰富的训练样本用于模型训练,提升模型的鲁棒性和泛化能力。数据增强技术包括但不限于比例缩放、水平/垂直翻转和图像随机裁剪技术。 [0059]在具体的设备设置上,本实施例采用了多层控制方式,地铁防淹门的控制线路及防淹门图像采集装置与设于地铁站内的近端监控系统连接,近端监控系统与设置在站外的远端监控中心连接,远端监控中心还与地铁控制中心的号志系统连接,并执行基于迁移学习技术的地铁防淹门状态检测图像识别的算法。 [0060]当远端监控中心识别到任一地铁站的现场图像出现水位异常时,立即通报地铁控制中心的号志系统,在确定隧道净空后,以遥控方式关闭升降式防淹门;当远端遥控无法正常执行时,则授权近端监控台执行近端遥控关闭作业。以现有的升降式地铁防淹门为例,关闭作业是发出指令并通过并地铁防淹门的控制线路启动起吊门扇的启闭机、平时承载门扇的挡板小车移动离开当前位置、推动小车伸出收回的电动推杆。当遇到特殊情况关门困难时,还应当启动下压机构。借助前述的多层控制及分层授权管理机制,可兼顾系统管理的可靠度与系统反应的时效性。 [0061]实施例二 [0062]在进行模型训练以及防淹门现场所获得的实时现场图像的处理中,本实施例通过OpenCV技术处理多张防淹门图像,并实现特征提取。 [0063]其中,通过OpenCV处理的步骤如下: [0064](1)利用resize(·)函数重新设置大小,统一输入地铁升降式防淹门图像大小; [0065](2)利用retval=img[y:y+h,x:x+w].copy()函数对输入的地铁升降式防淹门图像进行随机裁剪,本实施例中,设置裁剪的大小为330,将输入的图随机裁剪为330*330的图像,该参数设置可以达到超低分辨率,占用空间小的技术效果,其中x,y为像素值,是地铁升降式防淹门图像裁剪矩形区域的坐标值,w,h为像素值,是地铁升降式防淹门图像裁剪矩形区域的宽度、高度; [0066](3)利用im1=opcv.flip(im,1)和im2=opcv.flip(im,0)函数对随机裁剪后的地铁升降式防淹门图像分别依照默认的旋转概率进行水平/垂直翻转,其中opcv表示图像识别方法库,im为地铁升降式防淹门图像,0是绕X轴翻转,1是绕Y轴翻转; [0067](4)利用opcv.getRotationMatrix2D和opcv.warpAffine对翻转后的地铁升降式防淹门图像进行随机旋转,根据旋转角度和位移来计算放射矩阵,返回放射矩阵,作为后续warpAffine操作的输入。例如:传入参数是15度,那么就沿x轴正方向逆时针旋转45度,目的是让最终得到的图像没丢失任何信息。 [0068]具体如下所示: [0069] [0070]绕图像中心点(ux,uy)旋转β度,γ=cosβ,θ=sinβ; [0071](a)原图中的某个点:该点从中心点移动到原点 [0072](c)旋转该点从原点移动回中心点 [0073]其中,x和y表示原始图像中的某个点的坐标,(ux,uy)表示图像中心点。 [0074]上述(a)-(d)四个步骤实现了将图片绕其中心点旋转了β度。 [0075](5)利用normalize(·)函数对旋转变换后的地铁升降式防淹门图像进行归一化处理,使模型训练时梯度对每张图片的作用都是平均的; [0076](6)采用ResLNet实现特征提取,在图像分类数据集上进行预训练得到ResLNet的网络结构和参数。 [0077]实施例三 [0078]作为进一步的改进,在具体的在图像识别时,本实施例基于迁移学习的场景,通过优化损失函数、分类器函数拟合图像样本,分析图像结果,具体过程如下: [0079](1)将向量x分割成了N个低维嵌入xi,通过模型对低维表示进行变换,分别与相应的权重进行点积得到(wi·xi),把全部低维嵌入聚合得到 [0080](2)ResLNet利用聚合变换的思想,采用一个更通用的函数代替初等变换(wi·xi),聚合转换可以表示为: [0081](其中i≥1) [0082]其中,Z(xi)是任意函数,Z(xi)将x投影到一个嵌入表示中,然后进行转换。 [0083](3)在上述公式中,J是要聚合的转换集的数量,称为基数,最后,上述公式聚合转换用作残差函数,得到: [0084] [0085]其中,y为输出。 [0086](4)利用多分类支持向量机对输出特征y进行分类。 [0087]定义损失函数C,用来衡量对预估结果的不满意程度。当评分函数输出结果与真实结果之间差异越大,损失函数越大,反之越小。每个样本损失函数求和取平均。 [0088]Ci为第i条数据样本的多类SVM的损失函数: [0089] [0090]对于有N个训练样本对应N个标签的训练集数据,损失函数定义为: [0091] [0092]其中,Ci为第i条数据样本的多类SVM的损失函数,ki表示正确分类的标签,rki表示在正确分类标签上的评分,rq表示在不正确分类标签上的评分,N为样本个数。通过优化损失函数,SVM分类器函数将图像样本拟合,使得大部分样本输出的结果符合目标函数大于0。图像离超平面越远,评分绝对值越大,表示分类正确。 [0093]为进一步验证本发明图像识别的有效性,针对地铁升降式防淹门图像数据中存在的单一背景与复杂背景两种不同场景,分别进行了实验。在单一背景中,每张图像只有一个目标物体。在单一背景下模型分类平均准确率高达92.91%,验证了迁移模型的有效性。当识别到升降式防淹门存在异常状态时,立刻向图像识别监测点发送相应的异常讯息。在复杂背景中,每张地铁升降式防淹门图像中有多个物体,包含复杂的背景干扰。在复杂背景下,模型的分类平均准确率可以达到85.31%,这表明模型对于复杂背景中的杂质有较好的特征提取能力,对图像的背景与前景有较好的区分能力。 [0094]需要说明的是,本发明的流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。 [0095]在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。 [0096]最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
现在,一起体验智慧芽的产品和服务
自动注册,无需人工审核,即可立即开始查询专利
立即注册
澳门正版图库

AI助手