多光谱（RGB-T）行人检测、语义分割研究汇总

最新推荐文章于 2025-05-08 01:00:00 发布

原创最新推荐文章于 2025-05-08 01:00:00 发布 · 置顶 · 5.7k 阅读

30 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能

本文聚焦于多光谱（RGB-T）语义分割与行人检测的最新研究，深入解析了截至2020年初的代表性深度学习模型。探讨了MFNet、RTFNet等语义分割算法及多光谱行人检测的挑战与突破。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

当前的研究目标转向多光谱（RGB-T）语义分割和行人检测任务，我将对近些年使用深度学习算法设计的模型进行详细分析。以下为截止到2020年初已公开发表的论文目录。这两个领域的相关论文很少，主要原因还是数据获取和对齐的难度较大以及有效的多模态融合算法设计难度较大，两种模态间的信息差异性较大，因此使用简单融合方法的效果比较差。多光谱语义分割和行人检测都是目前只有两个数据集，之后会在论文详解中进行介绍。

1.RGB-T语义分割：
（1）MFNet: Towards Real-Time Semantic Segmentation for Autonomous Vehicles with Multi-Spectral Scenes（第一篇多光谱语义分割论文，也提出了目前仅有的两个数据集中的一个）
（2）RTFNet: RGB-Thermal Fusion Network for Semantic Segmentation of Urban Scenes（2019年目前效果最好的）
（3）PST900: RGB-Thermal Calibration, Dataset and Segmentation Network（第二个数据集）

2.RGB-T行人检测
1.Multispectral Deep Neural Networks for Pedestrian Detection（BMVC2016）
2.Multi-spectral Pedestrian Detection Based on Accumulated Object Proposal with Fully Convolutional Networks（ICPR2016）
3.Multispectral Pedestrian Detection using Deep Fusion Convolutional Neural Networks（ESANN2016）
4.Learning Cross-Modal Deep Representations for Robust Pedestrian Detection（CVPR2017）
5.FullyConvolutionalRegionProposalNetworks forMultispectralPersonDetection（CVPR workshop2017）

更新中