THIS DATASET DOES NOT EXIST: TRAINING MODELS FROM GENERATED IMAGES论文笔记

时间 2020-12-30 标签 THIS DATASET DOES NOT EXIST: TRAINI

文章概要：
问题：
在以往文章的实验中，单独利用生成样本训练模型性能相较于真实样本训练得到的模型性能下降很大，即使是biggan这样逼真的生成图像用来训练模型性能仍然下降很多。论文作者推测可能原因是：生成模型样本的多样性与真实样本相比较少。
方法：
文章中生成器是训练好的Biggan网络。
网络结构图：

文章提出了单纯利用生成数据训练网络的三种策略来解决生成样本训练模型性能差的问题：
1使用困难样本收集挖掘（ Hard Sample Mining (HSM)）
细节待补充
2.数据集平滑（ Dataset Smoothing (DS)）
细节待补充
3.自适应BatchNormal(Batch Norm statistics Adaptation (BNA)）
细节待补充
结果
最终在imagenet10上取得的效果略高于真实样本的结果:
ablation studies:
个人总结：利用GAN网络生成数据最主要的作用是用来解决真实样本难于获取的问题，如果能够利用生成数据训练得到与真实类似相似的性能，这对于解决少样本问题具有重要意义，尤其是医学图像利用. 但这种方式对于生成图像质量要求很高，需要高质量生成图像才能实现。是一个要解决的问题。