图像分割方法总结

刚看到一个图像分割的视频,讲的很粗略,但对于了解这方面知识的基础,还是很不错的。。

图像分割应用

在这里插入图片描述

分割的常用的三个数据集

在这里插入图片描述在这里插入图片描述在这里插入图片描述

传统的图像分割方法

在这里插入图片描述在这里插入图片描述
在这里插入图片描述

深度学习做图像分割

算法一:全卷积网络(FCN)

先进行卷积和池化,然后经过全连接,(VGG-16网络)提取出来图片特征,然后进行上采样(拿了三个池化层的结果,分别进行上采样,之后叠加,由粗到细,进行上采样预测),之后对每个像素用softmax分类。。
在这里插入图片描述在这里插入图片描述

图像分割上采样常用的方法:

(1)卷积操作:

在这里插入图片描述在这里插入图片描述在这里插入图片描述

(2)padding和stride

在这里插入图片描述

(3)双线性差值上采样

先在x轴上做线性差值,Q12和Q22得到R2,Q11和Q21得到R1
然后在y轴做线性差值由R1和R2得到P
所以P就是四个点线性加权得到的结果。。
在这里插入图片描述

双线性插值上采样的用途:

FCN是当做第一中种用途,现在的paper主要是后两种用途
在这里插入图片描述

(4)带洞卷积(膨胀卷积)

这样更利于考虑全局信息
在这里插入图片描述

(5)几种类型的特征金字塔

在这里插入图片描述
其中第四种性能最好:
操作方法:
1扩大两倍然后与2进行叠加,然后得到3
这样即利用了细节信息,又利用了全局信息。。
在这里插入图片描述

算法二:PSPNet

在这里插入图片描述

算法三:Mask-RCNN

在这里插入图片描述

(1)多分支预测

实际主体结构和faster R-CNN差不多,只是多了一个mask这个步骤

在这里插入图片描述

(2)binary mask

之前的FNC,是利用soft max进行多分类预测,这里是使用sigmoid进行二分类,准确率大幅提高
在这里插入图片描述

(3)Roi Align

作用:将feture map中的bounding box映射到原图中
在这里插入图片描述在这里插入图片描述在这里插入图片描述

Roi Align 与Roi pooling的关系

Roi Align实际是Roi pooling的精确版,pooling在映射时,是映射到旁边四个点中距离最近的点,而Align是对旁边四个点计算线性差值,这样更精确。。
因为分割任务度边框的精确度要求要比检测任务要求更高
在这里插入图片描述