与大部分分割网络相同,DeepMask一样应用了VGG模型做为特征提取的主要模块,在训练中也用了ImageNet下训练获得的VGG参数初始化这一部分模型。web
随后,DeepMask用两条分支来分别实现分割任务和前景目标识别任 务。下面咱们来具体看一下这两个分支:
(1) 分割部分网络
分割部分要实现的是对图块内场景的类别的识别,由一个1x1卷积层后接分类层实现。这里的分类是稠密的,也就是对每个像素都有其对应的标注。svg
这里须要注意的是,为了实现实例分割,分割部分的分支必须可以看到输入图块的全部信息,从而在多个目标同时存在时判断是否属于同一个咱们须要的目标。好比下图中有多头大象:3d
可是咱们只但愿标注出其中的一头:
(2) 前景Score部分xml
网络的第二个分支要完成的任务是,判断一个图块是否知足下面两个要求:
NO.1 :目标位于图块的正中心附近
NO.2: 目标完整存在于图块中(在某一尺度范围内)
这一部分由一个2x2的最大池化层,后接两个全链接层组成。最终的输出是一个目标score,用来显示该目标是否知足上面的要求。blog