【Person Re-id】A Discriminatively Learned CNN Embedding for Person Re-identification

时间 2021-01-07 标签 loss Re-id

verification model:同时输入image pairs，network预测输入图片是否为同一个人，将问题当成一个二分类来看。这样导致没有完全用到标注信息，image pairs和数据集中的其他图片的关系被忽略了。
identification model：将Person Re-id问题看做一个multi-class recognition task，利用数据的原始标注信息结合cross-entropy loss来训练数据。在一个batch中一起bp。其实潜在就融合了类内数据在高维空间相似和类间差异的要求。缺点是没有考虑图片对之间的相似性度量。
文章融合了这两种model。
文中提到在数据有限的时候，verification用contrastive loss会导致过拟合，所以文中采用了cross-entropy。dropout不能被用于contrastive loss前的embedding，而由于本文的loss是cross-entropy，所以采用了dropout。

网络用2个权值共享的CaffeNet同时预测2张输入图片的label，将预训练网络的最后一个FC换成卷积层，对于Market-1501用751个1*1*4096的卷积核进行卷积操作，再连接一层softmax进行输出归一化，对2个identification部分用cross-entropy loss。对于verification部分，直接在CaffeNet输出的4096维最高层特征上连接一个无参数的Square Layer，在后面再接一个卷积层将维数降为2，后用softmax进行输出归一化，对输出结果用cross-entropy loss进行参数学习。网络用3个cross-entropy loss同时进行参数训练。