202507 论文研读–基于深度学习的小目标林火检测实验设计与实现

作者:林海峰,马宇晨,蒋玲,薛琦琳

单位:1. 南京林业大学信息科学技术学院,江苏 南京 210037;2. 南京邮电大学计算机学院、软件学院、网络空间安全学院,江苏 南京 210023

来源:南京林业大学学报(自然科学版)

1.背景

近年来,全球森林火灾频繁发生导致巨大的财产损失和严重的安全隐患。若能迅速准确地检测到火源并采取有效措施,则将显著降低火灾造成的损失。目前林火目标检测相关研究主要集中在航拍下多尺度林火目标进行检测与定位,考虑到小目标林火隐蔽且易被树木遮挡,极易出现漏检情况,计算机视觉模型在小目标林火检测任务中的准确性通常不高。因此,这篇论文基于深度学习及计算机视觉,提出一种基于小目标森林火灾检测模型。

2.主要贡献

  1. 针对早期森林火灾中火源面积小、易被遮挡、检测难度大的问题,设计了 SFIRE-DetNet 模型。
  2. 借助 GhostNet 的 Ghost 模块设计了 Ghost_C3 主干网络。在保证检测精度的同时,显著降低了模型参数量和计算开销,适用于资源受限的无人机等场景。
  3. 在特征融合阶段加入 GAM 全局注意力机制,通过通道和空间注意力增强火点特征表达,提升了小目标火源的可辨识度。
  4. 传统 YOLO 检测层在小目标识别上效果有限,本文新增了一层分辨率为 160×160 的检测层,专门用于检测小尺寸火源。

3.方法

对于小目标检测任务,小目标分辨率低且尺寸小,因此主干网络需要有效地捕获并保留细微的特征信息,以便后续的检测算法能够准确地识别和定位小目标。

轻量级主干网络

GhostNet是轻量级神经网络架构,其采用 Ghost Module 这一模块,通过引入 Ghost 卷积核来减少模型的参数量和计算量,使网络的模型尺寸和计算复杂度降低。论文中的模型主干网络 Ghost_C3 借鉴了 YOLOv5 中拥有三层卷积层的 CSP 模块设计思想,将主干网络中的卷积模块替换成 Ghost 卷积模块,并生GhostConv 、C3Ghost 及GhostBottleneck 模块。在维持小目标林火检测精度不变的情况下,该设计大幅减少了模型训练参数量。

全局注意力机制

该模块通过采用 3D 排列和多层的感知机来实现通道注意力,并引入了专门用于空间注意力机制的卷积子模块,以增强全局范围内不同维度间的交互作用。这种方法能够在三个维度上有效提取关键特征,并通过利用每对三维通道、空间宽度以及空间高度间的注意力权重,进一步提升模型的处理效能。

小目标检测层

对于目标像素较小、分辨率较低且环境复杂的早期森林火灾图像,现有的 3 个特征尺寸并未取得理想的检测效果。因此,为了提升模型对小尺寸火焰目标的检测能力,在原始预测层的基础上,增加了输出尺寸为 160×160 的检测层,用于识别大于 4×4 尺寸的小目标火焰。

4.实验

4.1 实验设置

数据集准备
  • 使用公开 FLAME 数据集(无人机和卫星图像,覆盖多种林火类型)。
  • 自建数据集:通过网络爬虫采集多种地形、光照下的小目标火焰图像,满足 COCO 定义下“小目标”(<32×32 像素)标准。

4.2 实验结果

SFIRE-DetNet 模型能够准确地检测出图像中的所有火点,并且能够有效地区分干扰目标。然而,其他模型在检测过程中均出现了一定程度的漏检现象,图中蓝黄圆圈标注为漏检林火目标。

实验结果显示,SFIRE-DetNet 在 FPS 方面仅次于 SSD 和部分 YOLO 模型,但 SFIRE-DetNet模型 mAP 指标较 SSD 和 YOLO 模型分别高出 19.87%和 4.45%。

4.3 消融实验

在小目标林火检测任务中,GAM 注意力机制至关重要,虽然其引入在一定程度上导致了模型检测速度的微幅下降,但显著地提升了模型的检测精度,mAP50 提高了 3.56%。引入小目标检测层导致了模型推理速度的稍有下降。但这一改动显著提高了小目标检测的性能,使得 mAP50 提升了 2.2%。

5.总结

提出了一种基于深度学习的小目标森林火灾检测模型 SFIRE-DetNet。采用轻量级主干网络,引入 Ghost 卷积核来减少模型的参数量和计算量。引入全局注意力机制和小目标检测层,提高模型对小目标林火的特征提取能力,提升深度神经网络的性能。通过大量对比实验和消融实验,证明了 SFIRE-DetNet 模型在小目标林火检测精度和速度方面具有优异的性能。