Re-ID----换衣场景下的行人重识别

中科院,深圳先进技术研究院,余世杰

换衣场景下的行人重识别

 

难度一:换衣数据集目前比较少。原本的数据集每个人都穿着相同的衣服。

难度二:有研究表明,行人衣服的样式在检索的过程中还是占到非常大比重。

 

实例:犯罪嫌疑人通过乔装打扮躲避嫌疑人追捕,走失人员寻找。

 

 

工作使用的检索方法:

使用这种方法的理由:

1.衣服占到行人图片的绝大部分,不能完全忽略它们

2.人的生物信息:人脸,体型,头发等还是比较微弱,不具有较大的辨识性

 

 

如何得到衣服模板:

1.一般是寻找走失的人嘛,所以: 可以通过家人提供的信息

2.追踪嫌疑人:警察可以通过目击者的描述去网上搜到对应的图片

 

 

采集了大型换衣行人数据集:

1.该数据集每个人至少两套衣服

2.query中的每个id都会配备衣服模板,gallery中就会有query的id中id 穿类似衣服的图片

3.较多户外场景,大多数人有2-3件衣服,有不同程度遮挡的衣服

4.采集数据集的难点:如何将同一个人关联起来

           一个比较乱序的图片,根据传统re-id的特征进行聚类分成一个个簇,再根据人工的行为将杂质筛除掉。

           通过人脸识别:将行人图片进行分类,然后进行标注

          

评价指标:

query和gallery里检索出来的id要一致。

既要求id一致,又要求衣服一致。

使用衣服约束: 保证能够找到穿那个衣服的人

id的约束:保证能够提取出任务的生物性息

 

网络架构:

query:有行人图片也有衣服模板直接放进网络进行训练

target:没有衣服模板。使用clothes detector模块,基于R-CNN的预训练模型检测target image的衣服

 

网络第一部分:提取与衣服无关的特征:人脸,发行,体型等。 使用了attention,希望将与生物信息无关的特征过滤掉。

网络第二部分:提取衣服纹理,样式,颜色等

在后面进行特征融合,将两者特征融合起来。

 

 

损失函数: 

cross entropy:分类损失

triplet loss:希望学习到的特征,相同的人尽可能地相近,不同的人尽可能地远离。

 

 

mask module:

主要的目的:提取与衣服无关的特征

可视化mask:

发现关注在人脸的区域

 

消融实验:

只用生物特征,只用衣服特征,用人脸和衣服的特征