【Person Re-id】A Discriminatively Learned CNN Embedding for Person Re-identification

  1. verification model:同时输入image pairs,network预测输入图片是否为同一个人,将问题当成一个二分类来看。这样导致没有完全用到标注信息,image pairs和数据集中的其他图片的关系被忽略了。
  2. identification model:将Person Re-id问题看做一个multi-class recognition task,利用数据的原始标注信息结合cross-entropy loss来训练数据。在一个batch中一起bp。其实潜在就融合了类内数据在高维空间相似和类间差异的要求。缺点是没有考虑图片对之间的相似性度量。
  3. 文章融合了这两种model。
  4. 文中提到在数据有限的时候,verification用contrastive loss会导致过拟合,所以文中采用了cross-entropy。dropout不能被用于contrastive loss前的embedding,而由于本文的loss是cross-entropy,所以采用了dropout。
    这里写图片描述
    网络用2个权值共享的CaffeNet同时预测2张输入图片的label,将预训练网络的最后一个FC换成卷积层,对于Market-1501用751个1*1*4096的卷积核进行卷积操作,再连接一层softmax进行输出归一化,对2个identification部分用cross-entropy loss。对于verification部分,直接在CaffeNet输出的4096维最高层特征上连接一个无参数的Square Layer,在后面再接一个卷积层将维数降为2,后用softmax进行输出归一化,对输出结果用cross-entropy loss进行参数学习。网络用3个cross-entropy loss同时进行参数训练。