目标检测--SSD

时间 2020-12-30

SSD应该是和YOLO v2同一时期的论文，相比YOLO v1和RCNN系列，SSD借鉴了两者的优点，并加入了多尺度来弥补yolo在小物体检测的不足，在精度和速度上都超越了yolo v1。主要改进在于两点：
（1）多尺度feature map增加鲁棒性，既能检测大物体，又能检测小物体，增加精度；
（2）yolo使用全连接来预测，但是SSD采用卷积，保证速度。。

网络结构

1、base network为VGG-16，提取图片特征，后续又进行多次卷积操作，并对提取到的不同尺度的feature map都又进行了卷积，得到各个feature map的预测边框，将他们放到一起，一起进行NMS。
2、对每个feature map进行过卷积来获取预测的边框，这一点不同于faster-RCNN的滑动窗口，也不同于yolo的回归预测，确实很优秀
3、不同尺度的feature map进行预测时，anchor box的大小不同
4、训练过程类似于faster R_CNN，预测框的目标值的计算方法与RCNN一致，损失函数也大致相同

总结

SSD的整体思想类似于YOLO，都希望端到端的解决问题，但在训练包括损失函数的设计上，类似于faster R_CNN，同时又有这两者没有的，就是多尺度的feature map，这样，既保证精度，又保证速度。。