文章信息
- 王驰, 占李黎, 于明坤, 李富迪, 张鼎
- WANG Chi, ZHAN Lili, YU Mingkun, LI Fudi, ZHANG Ding
- 基于机器学习的抛撒地雷夜视智能识别研究
- Research on night vision intelligent recognition method of scatterable landmines based on machine learning
- 中国测试, 2022, 48(11): 34-40
- CHINA MEASUREMENT & TEST, 2022, 48(11): 34-40
- http://dx.doi.org/10.11857/j.issn.1674-5124.2021060190
-
文章历史
- 收稿日期: 2021-06-28
- 收到修改稿日期: 2021-09-07
2. 近地面探测技术重点实验室,江苏 无锡 214035
2. Science and Technology on Near-surface Detection Laboratory, Wuxi 214035, China
利用投射的方式将地雷散布在预定区域(即抛撒地雷),具有快速、灵活、机动性高等优点[1],易于实现大规模大面积雷场的高效布设。现代地雷配备的引信可使目标靠近到一定距离时即触发,在夜间微弱光条件下对抛撒地雷的远距离探测难度更大。此外,大量抛撒地雷被组合使用形成地雷场,地雷场是指特定的一块区域,其中按照一定正面、纵深和密度布设防坦克或防步兵地雷,远距离被动式快速检测是现代雷场安全探测的一个重要研究方向[2-5]。目前对于抛撒地雷的远距离探测技术主要可分为成像检测技术和非成像检测技术,成像技术如红外、雷达、多光谱和卫星遥感等,在夜间光线强度很弱时成像效果较不理想,存在受周围环境干扰大、隐蔽性差、成像不清晰等缺点,探测精度稳定性较差[6-9];非成像技术如脉冲雷达技术等,通过获取抛撒地雷的辐射信号进行目标信号的处理和检测,通信传输繁杂,受周围环境影响较大,尤其对夜间抛撒地雷的探测难度较大[10-12]。因此,对夜间抛撒地雷进行探测实验研究,分析不同时间、不同场景中对抛撒地雷和多雷区的探测精度,可为真实场景中抛撒地雷的有效探测提供方法基础。
利用高精度被动式微光夜视仪能够实现在夜视场景中对抛撒地雷远距离清晰成像,不需要主动照明光源,且具有隐蔽性强、受环境影响小等特点[13-16],在抛撒地雷远距离夜视智能检测方面具有广阔的应用前景。在文献[17]中,运用YOLO(V2)算法构建了抛撒地雷智能检测网络模型,利用几何光学成像的三角形相似性原理,实现对抛撒地雷距离的快速测算,初步验证了抛撒地雷夜视智能检测模型算法,但其选用的实验场景相对简单,缺少考虑抛撒地雷在实际情况中有可能被部分土壤遮挡等因素。为此,本文在已有研究成果基础上,利用基于机器学习的被动式夜视智能探雷方法与探雷系统,结合微光夜视仪技术,对不同场景下的抛撒地雷进行智能识别的实验研究,分析不同场景对抛撒地雷的影响,并对含有多个抛撒地雷的区域(多雷区)进行智能探测方法的实验研究。
1 抛撒地雷的夜视智能识别方法本文研究的抛撒地雷智能检测方法基于文献[17]所提出的抛撒地雷智能检测网络模型。首先,根据YOLO (V2)算法,将Darknet-19作为抛撒地雷智能检测网络模型的基本架构,该架构由19个卷积层和5个最大池化层组成,Darknet-19网络使用了3×3的卷积核和全局平均池化,将1×1的卷积核置于3×3的卷积核之间,用来压缩特征;在每一个卷积层后使用批量归一化方法稳定网络模型训练,加速收敛并泛化网络模型。本文应用的YOLO(V2)网络结构如图1 所示。
![]() |
图 1 YOLO V2网络结构图 |
将输入的抛撒地雷图片归一化为832×832像素、3通道的标准输入图片,此时具有832×832×3个数值,经过13层卷积和4次池化将图片转换为52×52像素、512通道的特征图。从两个方向处理特征图:第一个方向是将52×52×512个数值重新组合成26×26像素和2048通道的特征图,第二个方向是经过1层池化和7层卷积将特征图转换为26×26像素和1024通道的特征图。将两个处理方向的结果进行融合得到26×26像素和3072通道的特征图,经过2层卷积得到最终的特征图。
定义4种变量:TureMines、TureNMines、FalseMines、FalseNMines。其中,TureMines表示目标为抛撒地雷,且被正确检测为抛撒地雷;TureNMines表示目标不为抛撒地雷,且未被误检为抛撒地雷;FalseMines表示目标不为抛撒地雷,但被误检为抛撒地雷;FalseNMines表示目标为抛撒地雷,但未被检测为抛撒地雷。召回率和精确率由公式(1)和公式(2)计算:
$ {\rm{Recall}} = \frac{{{\rm{TureMines}}}}{{{\rm{TrueMines}} + {\text{ }}{\rm{FalseNMines}}}} $ | (1) |
$ {\rm{Precision}} = \frac{{{\rm{TrueMines}}}}{{{\rm{TrueMines}} + {\text{ }}{\rm{FalseMines}}}} $ | (2) |
利用上述公式和网络模型的均值平均精度(mAP)指标对抛撒地雷智能检测网络进行以下优化:对抛撒地雷智能检测网络模型的每一层参数进行统计,根据其分布规律自定义每一层的裁剪比例,选择较小比例的数据进行剪裁,比例从0~50%不等,剪枝前模型参数量为193 Mb,剪枝后模型参数量为133 Mb,剪掉31.088%的参数量;采用动态定点的权值精简方式对抛撒地雷智能检测网络模型进行量化处理,确定一个定点后的固定数据位宽,然后通过分析数据集合的特点,确定定点位置,将数据转换为定点数,多余位宽数据截断,完成量化处理。模型优化前后的抛撒地雷图像测试集的PR曲线(即横纵坐标组成的坐标点)如图2所示。测试集测试结果显示,模型优化前测试集的召回率为96.64%,精确率为97.14%,均值平均精确度为95.286%;模型优化后测试集的召回率为99.22%,精确率为98.98%,均值平均精确度为99.2%。模型优化后,测试集相关指标明显提高。
![]() |
图 2 模型测试集的PR曲线 |
此外,根据几何光学的三角形相似性原理,实现对抛撒地雷距离的测算。将采集到的抛撒地雷图像中抛撒地雷目标的像素坐标转化为实际坐标,在检测出地雷目标后,确定目标地雷到相机的实际距离。并且利用先验数据对抛撒地雷的测距模型进行误差补偿,使抛撒地雷测距模型的检测精度进一步提高,在6~22 m的测距范围内,该模型的测距误差在±10 cm之内。
2 实验系统与测试方案 2.1 实验系统抛撒地雷智能识别实验系统如图3所示,采用德国元奥仪器公司(PCO)的PCO.edge4.2夜视高速相机,镜头为尼克尔(Nikkor)D型定焦镜头,相机输出分辨率为2060×2048,成像波段0.3~1.0 μm,像元尺寸为6.5 μm×6.5 μm,F数为1.8,物镜焦距50 mm。采用嵌入式端的机器学习进行硬件设计,将抛撒地雷智能检测网络模型与抛撒地雷测距模型移植到FPGA硬件开发板中,并采用工控机处理终端,将夜视相机PCO.edge4.2放置于相机支撑架上,通过CameraLink数据传输线连接工控机,工控机通过数据线连接显示屏。
![]() |
图 3 抛撒地雷智能识别实验系统 |
抛撒地雷智能识别实验系统搭建完成后,选择实验场地为户外,在夜晚不同时间进行实验测试。用到的抛撒地雷目标包括72式防坦克金属地雷(直径31 cm)、69式防坦克塑壳地雷(直径28 cm)、58式防步兵橡胶地雷(直径15 cm)。放置抛撒地雷目标时选择多种背景,包括平坦水泥路面、矮小灌木丛、杂草丛、树林等,测试地雷在距离相机5,10,15,18,21 m进行测距实验。
2.2 测试方案设计利用上述实验系统及方法,以72式防坦克金属地雷、69式防坦克橡胶地雷、58式防步兵橡胶地雷作为抛撒地雷目标,设计以下3种不同场景进行被动式夜视智能识别实验:1)在晴朗夜间,无明显干扰物、背景为简单的灌木丛和树林,抛撒地雷完全裸露在草地上;2)在晴朗夜间,有石块、土块、杂草、落叶、落花等较多干扰物的复杂场景,地雷的裸露面积被轻微遮挡;3)在晴朗夜间,有石块、土块、杂草、落叶、落花等较多干扰物,地雷的裸露面积大部分被遮挡。采集上述场景下的抛撒地雷图像,建立数据集进行测试,利用公式(1)和公式(2)验证该模型的召回率和准确性,及检测的漏警率Miss rate和虚警率False alarm,见公式(3)和公式(4),分析对比3种场景下抛撒地雷的探测精度。
$ {\rm{Miss}}{\text{ }}{\rm{rate}}{\text{ = }}\frac{{{\rm{FalseNMines}}}}{{{\rm{TureMines}}{\text{ + }}{\rm{FalseNMines}}}} $ | (3) |
$ {\rm{False}}{\text{ }}{\rm{alarm}}{\text{ = }}\frac{{{\rm{FalseMines}}}}{{{\rm{FalseMines}} + {\rm{TureNMines}}}} $ | (4) |
实验过程中,根据周围环境调节相机的曝光时间,调节定焦镜头光圈,使探测区域能够在相机中清晰成像,相机采集到的图像通过CameraLink数据传输线传输到工控机,利用抛撒地雷智能检测网络模型对采集到的图像进行识别,若识别到抛撒地雷目标,将其进行标注并返回抛撒地雷目标的像素坐标值。将构建的抛撒地雷测距模型利用C++编程语言编写程序,输入的像素横坐标为抛撒地雷目标像素横坐标的平均值,输入的像素纵坐标为抛撒地雷目标中最大的纵坐标值,通过抛撒地雷测距模型进行计算,显示记录抛撒地雷的实际距离。
本文利用4个地雷布设简易多雷区进行雷区范围标定实验。多雷区由多个地雷共同组成,满足一定距离或者密度关系的地雷才可当作是雷区一员,当一个地雷目标与其他地雷距离较近时,是雷区中心点的可能性较大,对决策的影响也越大。图4为地雷与雷区关系示意图,其中0、1、2、3、4、5为6个地雷,圆圈区域为多雷区。可以看出,0点远离雷区,若把0点当作雷区中的一点时,雷区中危险性较小的区域将被扩大很多,不利于最佳决策,所以0点对决策者的影响很小。4点与雷区距离较近,若雷区包括这点时,对决策的贡献也与0点一样较小。5点与4点类似,而1、2、3三点则属于雷区的范围之中,是构成雷区的元素之一。为评价个点对决策的影响,实现雷场的约简方法,引入“吸引子”的概念,是一个用来反映雷区中地雷与其他地雷之间依赖性强弱的量,当某个地雷远离其他地雷目标时,其吸引子数值小,反之吸引子数值增大。“吸引子”概念是借用了物理学中引力的概念,用来描述地雷间的相互作用,即当地雷目标与其他地雷距离较近时,是雷区中点的可能性越大,与它距离近的地雷数越多时,是雷区中点的可能性也越大,对决策的影响越大。通过“吸引子”判断单个地雷对雷区的影响,然后使用雷区样本训练获取门限,将低于门限的孤立地雷进行去除。
![]() |
图 4 孤立雷排除原理图 |
设场景中共存N个地雷,其位置分别表示为
$ {{L}}_{{{i}},{{j}}}^{{M}} = {\left\| {{{M}}\left( {{{{r}}_{{i}}},{{{x}}_{{i}}}} \right) - {{M}}\left( {{{{r}}_{{j}}},{{{x}}_{{j}}}} \right)} \right\|_2},{{j}} \ne {{i}} $ | (5) |
其中
$ {{{T}}_{{i}}} = \sum\limits_{{{j}} = 1,{{j}} \ne {{i}}}^{{N}} 1 /{{L}}_{{{i}},{{j}}}^{{M}} $ | (6) |
吸引子用于去除对雷区影响较小的点,孤立点的吸引子数值小,而密度较大的雷区中地雷的吸引子数值较大。因此本文将地雷实际位置大致按图中0、1、2、3点的位置设置,根据“吸引子”的概念,定义相近距离地雷的吸引子设置门限值,将吸引子大于这个门限的地雷合并,排除孤立雷。然后确定多雷区范围并进行标定。在排除孤雷之后,分别取其他抛撒地雷的最外侧像素坐标值,带入已经训练好的抛撒地雷智能测距模型,将测距模型测量出的抛撒地雷距离与利用激光测距仪测量的数据进行对比,并圈定为多雷区,验证被动式夜视智能探雷系统对多雷区的探测有效性。
3 实验结果分析 3.1 不同场景下抛撒地雷智能识别实验首先,在草地环境较简单空旷、干扰物少或不明显、地雷基本裸露无遮挡的场景下,背景为灌木丛和树林的抛撒地雷可以被准确识别出来,如图5和图6的绿色矩形边框所示。该测试集共含有387张照片,现能检测出抛撒地雷的照片数量为383张,4张未检测出来。对测试集指标进行分析,在该情境下利用上述公式(1)~(4)计算可得抛撒地雷识别的精确率为98.97%,召回率为99.22%,漏警率为0.78%,虚警率为1.03%。
![]() |
图 5 背景为灌木丛 |
![]() |
图 6 背景为树林 |
第2个场景是有部分石块、土块、杂草、落叶、落花等干扰物,将防坦克地雷与防步兵地雷的裸露面积轻微遮挡来进行布设,相隔一定的距离,对其进行抛撒地雷的识别实验。实验结果如图7和图8所示,被轻微遮挡的抛撒地雷可以被检测出来,防步兵地雷会存在漏检情况。在此种情境下,分析测试集数量通过计算得抛撒地雷的识别精确率为98.5%,召回率为71.3%,虚警率为1.5%,漏警率为28.7%。
![]() |
图 7 3个地雷全部检测出 |
![]() |
图 8 一个防步兵地雷漏检 |
第3个场景是有明显干扰物的复杂环境中,将抛撒地雷置于落花、石块、落叶较多的草丛之中,对其裸露面积进行大部分遮挡;放置另一个抛撒地雷于干净整洁的路边,背景为草地,用一根树枝对其裸露面积进行遮挡。测试被动式夜视智能探雷网络模型在地雷面积被部分遮挡时检测的有效性,分析抛撒地雷暴露面积对智能探测的影响。实验结果,如图9所示,该模型仍能够将部分面积被遮挡的抛撒地雷用绿色边框识别框选出来,并对测试集整体识别结果分析,计算得到被干扰物遮挡的抛撒地雷的识别精确率为87.5%,召回率为56.8%,虚警率为12.5%,漏警率为43.2% ,表明抛撒地雷暴露面积的大小对抛撒地雷的夜间智能识别结果影响较大。
![]() |
图 9 部分被遮挡地雷检出 |
分析3种不同情景下的抛撒地雷识别指标,并进行对比,如表1所示。
实验场景 | 精确率 | 召回率 | 虚警率 | 漏警率 |
无干扰物、较简单场景、无明显遮挡 | 98.97% | 99.22% | 1.03% | 0.78% |
石块土块等干扰物、轻微遮挡 | 98.5% | 71.3% | 1.5% | 28.7% |
抛撒地雷被部分遮挡 | 87.5% | 56.8% | 12.5% | 43.2% |
分析不同场景下的抛撒地雷智能识别实验结果,在无干扰物、较为简单场景、地雷无遮挡情景下的精确率与召回率指标最好,而在有土块、石块、杂草、落花等较多干扰物且地雷部分面积被轻微遮挡为时,对抛撒地雷识别的精确率为98.5%,召回率为71.3%,被干扰物遮挡面积较多时的抛撒地雷的识别精确率为87.5%,召回率为56.8%,说明本文应用的被动式夜视智能探雷方法及探雷系统识别精确率等受干扰物复杂度、地雷被遮挡程度的影响。此外,本文对有土块、石块、杂草、落花等较多干扰物情景下漏检的抛撒地雷进行分析,分析表明对于防坦克地雷检测的漏警率较低,仅在漏检的抛撒地雷中占0.9%,而对防步兵地雷的漏警率较高,在漏检的抛撒地雷中占99.1%。由于防步兵地雷体积较小,在整体场景中,目标较小,识别难度较大,且受周围干扰物及遮挡物的影响程度较大,故漏警率较高。
3.2 多雷区识别实验利用被动式夜视智能探雷系统对多雷区进行智能识别,根据显示器显示记录:智能探雷系统共识别出4个抛撒地雷,并分别给出像素坐标值,见图10(图中只截取了其中3个地雷)。
![]() |
图 10 多雷区智能识别界面图 |
被动式夜视智能探雷系统在完成多雷的智能识别的基础上,反馈识别出的抛撒地雷目标框的对角线像素坐标值,分别取其像素平均值进行研究分析,4颗抛撒地雷的位置及利用测距模型测算地雷真实距离位置的像素坐标如表2所示。
坐标 |
|
|
|
|
|
762 | 1069 | 750 | 360 |
|
510 | 609 | 688 | 1210 |
|
–61 | –3 | 43 | 75 |
|
977 | 610 | 613 | 610 |
将上述坐标值分别代入公式(5)计算两两地雷间的距离,计算结果如表3所示。
测试指标 | L01 | L02 | L03 | L12 | L13 | L23 |
探雷系统数据/cm | 743 | 1136 | 1480 | 543 | 929 | 283 |
测距模型数据/cm | 371 | 378 | 392 | 45 | 77 | 32 |
用公式(6)计算吸引子数值,如表4所示。
结合上述实验原理,根据所得数据定义相近距离设置门限2×10–2,
在排除0号孤立雷之后,取多雷区最外侧1、2、3号抛撒地雷的像素坐标值,带入已经训练好的抛撒地雷智能测距模型,由表3可得最外侧抛撒地雷相互间距离
![]() |
图 11 多雷区标定及外扩示意图 |
4 结束语
本文根据在真实抛撒地雷探测时,探测环境较为复杂,可能存在石块、树叶等干扰物的影响,而且抛撒地雷在布设时会存在部分面积被遮挡的可能,以及大量抛撒地雷被组合使用形成的地雷场,设计了3种不同场景下,对抛撒地雷进行识别实验,研究了“多雷区”的识别方法,设计实验分析该方法对夜间多雷区远距离智能探测的可行性。结果表明,在微弱夜间光的复杂情景下,本文应用的方法可对不同场景下的抛撒地雷进行有效识别;并实现了在夜间对“多雷区”的智能识别与标定,为大面积真实抛撒地雷场的夜间智能探测提供了一定的研究基础和方法借鉴。
[1] |
BAUR J, STEINBERG G, NIKULIN A, et al. Applying deep learning to automate uav-based detection of scatterable landmines[J].
Remote Sensing, 2020, 12(5): 859-875.
DOI:10.3390/rs12050859 |
[2] |
YU Y, LIU B, CHEN Z, et al. A Macro-pulse photon counting lidar for long-range high-speed moving target detection[J].
Sensors, 2020, 20(8): 2204-2216.
DOI:10.3390/s20082204 |
[3] |
张石磊, 崔宇, 邢慕增, 等. 光场成像目标测距技术[J].
中国光学, 2020, 13(6): 1332-1342.
|
[4] |
FRIGUI H, ZHANG L, GADER P D. Context-dependent multisensor fusion and its application to land mine detection[J].
IEEE Transactions on Geoscience and Remote Sensing, 2010, 48(6): 2528-2543.
DOI:10.1109/TGRS.2009.2039936 |
[5] |
KASBAN H, ZAHRAN O, SAYED M, et al. A comparative study of landmine detection techniques[J].
Sensing and Imaging:An International Journal, 2010, 11(3): 89-112.
DOI:10.1007/s11220-010-0054-x |
[6] |
田文忠, 赵庆展, 胡浩伟, 等. 无人机高光谱载荷性能交叉验证[J].
中国测试, 2019, 45(11): 131-137.
DOI:10.11857/j.issn.1674-5124.2018010009 |
[7] |
何微微, 武魁军, 傅頔, 等. 临近空间风温遥感干涉仪设计及正演[J].
光学精密工程, 2020, 28(8): 1678-1689.
|
[8] |
MONTIEL-ZAFRA V, CANADAS-QUESADA F J, VERA-CANDEAS P, et al. A novel method to remove GPR background noise based on the similarity of non-neighboring regions[J].
Journal of Applied Geophysics, 2017, 144: 188-203.
DOI:10.1016/j.jappgeo.2017.07.010 |
[9] |
刘祚时, 周继雯, 俞跃, 等. 油气管道聚乙烯层粘接缺陷的红外热成像检测方法和信号增强技术研究[J].
中国测试, 2019, 45(11): 1-8.
DOI:10.11857/j.issn.1674-5124.2018070066 |
[10] |
ŠIPOš D, GLEICH D. A Lightweight and low-power uav-borne ground penetrating radar design for landmine detection[J].
Sensors, 2020, 20(8): 2234-2252.
DOI:10.3390/s20082234 |
[11] |
FREELAND R S, MILLER M L, YODER R E, et al. Forensic application of FM-CW and pulse radar[J].
Journal of Environmental and Engineering Geophysics, 2003, 8(2): 97-103.
DOI:10.4133/JEEG8.2.97 |
[12] |
凡丽梅, 董方旭, 安志武, 等. 橡胶/铝合金粘接构件脱粘缺陷非线性超声检测技术研究[J].
中国测试, 2020, 46(8): 15-21.
DOI:10.11857/j.issn.1674-5124.2020090080 |
[13] |
CHRZANOWSKI K. Review of night vision technology[J].
Opto-Electronics Review, 2013, 21(2): 153-181.
|
[14] |
刘超, 张晓晖. 超低照度下微光图像的深度卷积自编码网络复原[J].
光学精密工程, 2018, 26(4): 951-961.
|
[15] |
GADE R, MOESLUND T B. Thermal cameras and applications: a survey[J].
Machine Vision and Applications, 2014, 25(1): 245-262.
DOI:10.1007/s00138-013-0570-5 |
[16] |
YUAN T, HAN Z H, LI L, et al. Tunable-liquid-crystal- filter-based low-light-level color night vision system and its image processing method[J].
Applied optics, 2019, 58(18): 4947-4955.
DOI:10.1364/AO.58.004947 |
[17] |
王驰, 于明坤, 杨辰烨, 等. 抛撒地雷的夜视智能探测方法研究[J]. 中国光学, 2021, 14(5): 1202-1211.
|