FCOS 学习笔记

FCOS: Fully Convolutional One-Stage Object Detection

1. 前言

目前大多数先进的目标检测模型，例如RetinaNet、SSD、YOLOv3、Faster R-CNN都依赖于预先定义的锚框。相比之下，本文提出的FCOS是anchor box free，而且也是proposal free，就是不依赖预先定义的锚框或者提议区域。通过去除预先定义的锚框，FCOS完全的避免了关于锚框的复杂运算，例如训练过程中计算重叠度，而且节省了训练过程中的内存占用。更重要的是，本文避免了和锚框有关且对最终检测结果非常敏感的所有超参数。由于后处理只采用非极大值抑制(NMS)，所以本文提出的FCOS比以往基于锚框的一阶检测器具有更加简单的优点。

1.1 锚框的缺点

检测表现效果对于锚框的尺寸、长宽比、数目非常敏感，因此锚框相关的超参数需要仔细的调节。
锚框的尺寸和长宽比是固定的，因此，检测器在处理形变较大的候选对象时比较困难，尤其是对于小目标。预先定义的锚框还限制了检测器的泛化能力，因为，它们需要针对不同对象大小或长宽比进行设计。
为了提高召回率，需要在图像上放置密集的锚框。而这些锚框大多数属于负样本，这样造成了正负样本之间的不均衡。
大量的锚框增加了在计算交并比时计算量和内存占用。

2. 网络结构

其中classification对应的是分类损失，regression输出特征维度是4对应的是中心点相对于上下左右边界的距离，其中这个距离是在特征图尺度上表示的。

此外，中心点到四个边界的距离到原图上中心点到四个边界的实际距离存在如下的映射关系。l,r,t,b分别各自对应了上下左右的距离，s代表了原图到特征图的缩放尺度，还原到原图需要乘上相应的系数s。

3. 正负样本的匹配

3.1 正负样本分配

在传统基于Anchor-Based的检测算法中，通常是将设计的Anchor模板与Gt Box计算IOU，在一定范围内的才算作正样本，但是在FCOS算法舍弃了Anchor之后必须采用新的正负样本分配策略。

在特征图上的每个点，只要在某个GT Box内就可以算作正样本。2019年早期版本论文当中是采用的右边的策略，但是往往会产生很多低质量的正样本，因此在2020年版本的论文当中，选择使用GT Box内部的一个Sub Box即靠近中心的一个Box，落入Sub Box的点才算正样本，具体计算SubBox按如下公式计算得出，其中系数r需要手动设置。