图像分割方法总结

时间 2020-12-30

刚看到一个图像分割的视频，讲的很粗略，但对于了解这方面知识的基础，还是很不错的。。

图像分割应用

先进行卷积和池化，然后经过全连接，（VGG-16网络）提取出来图片特征，然后进行上采样（拿了三个池化层的结果，分别进行上采样，之后叠加，由粗到细，进行上采样预测），之后对每个像素用softmax分类。。

先在x轴上做线性差值，Q12和Q22得到R2，Q11和Q21得到R1
然后在y轴做线性差值由R1和R2得到P
所以P就是四个点线性加权得到的结果。。

FCN是当做第一中种用途，现在的paper主要是后两种用途

这样更利于考虑全局信息

其中第四种性能最好：
操作方法：
1扩大两倍然后与2进行叠加，然后得到3
这样即利用了细节信息，又利用了全局信息。。

实际主体结构和faster R-CNN差不多，只是多了一个mask这个步骤

之前的FNC，是利用soft max进行多分类预测，这里是使用sigmoid进行二分类，准确率大幅提高

作用：将feture map中的bounding box映射到原图中

Roi Align实际是Roi pooling的精确版，pooling在映射时，是映射到旁边四个点中距离最近的点，而Align是对旁边四个点计算线性差值，这样更精确。。
因为分割任务度边框的精确度要求要比检测任务要求更高