适配方法
Cascade RCNN
介绍
Cascade RCNN是一种多阶段目标检测方法,将基础模型提取的视觉特征信息通过级联多个不同IoU阈值的检测器来训练,从而改善由固定IoU阈值训练导致的过拟合和噪声检测的问题。
论文引用
@article{2017Cascade,
title={Cascade R-CNN: Delving into High Quality Object Detection},
author={ Cai, Zhaowei and Vasconcelos, Nuno },
year={2017},
}
DINO
介绍
DINO方法是一个DETR类的检测器,将物体检测任务视为一个集合预测问题,直接通过端到端的训练,省去了传统多阶段目标检测算法中手工设计处理的模块。DINO方法的主要思想是针对DETR模型中编码器-解码器结构进行了优化来进一步提高图像序列到集合序列转换的速度和精度。该集合实际上就是一个可学习的位置编码。具体的改进体现在三个方面,分别是:引入正负噪音样本来提高检测器对负样本的感知能力;采用混合查询选择方法,对编码器的输出的TOP-K的位置信息作为锚框的初始化,将内容查询仍保留为可学习的参数;优化了解码器的梯度传播,将梯度信息的分离用于对预测框的更新迭代。
论文引用
@article{2022DINO,
title={DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection},
author={ Zhang, Hao and Li, Feng and Liu, Shilong and Zhang, Lei and Su, Hang and Zhu, Jun and Ni, Lionel M. and Shum, Heung Yeung },
journal={arXiv e-prints},
year={2022},
}