目标检测--SSD

SSD应该是和YOLO v2同一时期的论文,相比YOLO v1和RCNN系列,SSD借鉴了两者的优点,并加入了多尺度来弥补yolo在小物体检测的不足,在精度和速度上都超越了yolo v1。主要改进在于两点:
(1)多尺度feature map增加鲁棒性,既能检测大物体,又能检测小物体,增加精度;
(2)yolo使用全连接来预测,但是SSD采用卷积,保证速度。。

网络结构

在这里插入图片描述1、base network为VGG-16,提取图片特征,后续又进行多次卷积操作,并对提取到的不同尺度的feature map都又进行了卷积,得到各个feature map的预测边框,将他们放到一起,一起进行NMS。
2、对每个feature map进行过卷积来获取预测的边框,这一点不同于faster-RCNN的滑动窗口,也不同于yolo的回归预测,确实很优秀
3、不同尺度的feature map进行预测时,anchor box的大小不同
4、训练过程类似于faster R_CNN,预测框的目标值的计算方法与RCNN一致,损失函数也大致相同

总结

SSD的整体思想类似于YOLO,都希望端到端的解决问题,但在训练包括损失函数的设计上,类似于faster R_CNN,同时又有这两者没有的,就是多尺度的feature map,这样,既保证精度,又保证速度。。