论文来源:ICASSP
发表日期:2025
作者:Yilin Zhao , Qing Zhang, and Yuetong Li
研究现状
伪装物体通常通过形状、颜色或图案来与周围环境融为一体,与背景之间的差异微小,难以被传统的目标检测方法识别。作者提出了一种新的伪装物体检测网络,命名为FHCNet,该网络结合了CNN和Transformer的优势,协同利用局部特征与全局特征来捕获伪装的对象并识别不可感知的边界。
创新点
- 特征一致性协调模块(FCH):该模块通过对CNN和Transformer特征的层内融合,弥合两者的语义差距,从而充分利用两者在局部细节和全局上下文中的互补优势。
- 跨层特征校准模块(CFC):该模块通过自适应校准策略,优化不同层次特征的融合,确保深层语义信息与浅层空间细节的平衡,从而提高检测精度。
研究内容
作者提出的FHCNet架构如下所示:

- 网络将输入图像分别通过CNN和Transformer编码器,提取多尺度特征
- FCH模块:对输入的全局特征和局部特征分别作局部增强和全局增强操作,同时对全局特征和局部特征进行融合,通过注意力机制关注全局特征特征和局部特征中的有效信息,以此实现全局特征和局部特征的互补增强。
- CFC模块:将从深层和浅层得到的特征按照通道维度进行分组。通过shuffle和split操作,对特征进行重排,以便能够在不同层次间实现有效的对接和整合。在得到重排后的跨层特征后,使用学习得到的可训练参数(λj\lambda_jλj)来调节每个特征在最终融合中的权重,以此来实现根据每个特征的贡献程度,调整其在最终预测中的重要性。
损失函数

实验
Dataset
在实验过程中,采用了CAMO数据集中1000幅图像和COD10K的3040张图片作为训练集对模型进行训练。使用伪装目标检测基准数据集CAMO、COD10K、NC4K上对模型进行评估。
评指估标
以Structure-measure(Sα),Mean Enhanced-measure(Eφ),Weighted F-measure(Fβw), adaptive E-measure(αE), Mean Absolute Error(MAE)作为最终的分割效果评价指标。
实验结果

实验结果显示,网络在复杂背景下表现突出,说明了FCH模块通过协调局部特征与全局特征,消除两者之间的语义差异,使模型能够更好地捕捉伪装物体的细节和全局语义,提升了检测精度。此外CFC模块,通过自适应校准跨层特征的融合,确保了深层和浅层特征的有效结合,从而进一步提升了检测的准确性。
可视化

从图中可以看出,FCHNet能够有效处理复杂背景以以及小物体等情况。
结论
针对伪装目标检测任务,作者提出了一种新的伪装物体检测网络(FHCNet),旨在通过结合CNN和Transformer的优势,克服伪装物体检测中的局部与全局特征提取之间的差异。实验表明,FHCNet通过FCH和CFC两个创新模块,充分发挥CNN和Transformer的互补优势,显著提升了伪装物体检测的精度。
启发
实验表明, 局部特征和全局特征的协同融合对提高目标检测精度的重要性。在面对复杂背景时,局部特征和全局特征的融合策略也可能成为提升性能的关键。
CFC模块的引入有效解决了深层和浅层特征之间的协调问题。通过自适应校准,CFC确保了特征融合的精度,避免了信息丢失或误差的累积。这一融合策略可以延伸到当前的实验中,解决深层特征和浅层特征融合效果不好的问题。