联邦学习

联邦学习分类

  • 横向联邦学习

(图片源于论文Federated Machine Learning: Concept and Applications)

每一行为一个样本sample,每一列为一个特征feture,有些数据集包含标签label。

横向联邦学习适用于样本特征相似性大,但是用户数据重叠部分较小的情况。例如在金融领域,不同地区的银行,他们的用户数据重叠较少,但是用户涉及到的业务几乎类型一样。

  • 纵向联邦学习

     

(图片源于论文Federated Machine Learning: Concept and Applications)

每一行为一个样本sample,每一列为一个特征feture,有些数据集包含标签label。

纵向联邦学习适用于样本用户数据集重叠部分较大,但是样本用户特征重叠部分较小的情况。例如在同一地区,一家银行和一家商场,他们涉及到的用户几乎为其所在地的用户,所以重叠部分较大,但是银行涉及到的用户信息为存款金额等,但是商场涉及到的用户信息为用户的消费金额,购买物品品牌等信息,二者涉及到的用户重叠部分较大,但是涉及到的用户数据的特征相似性较低。

  • 联邦迁移学习

(图片源于论文Federated Machine Learning: Concept and Applications)

联邦迁移学习适用于用户数据集重叠部分较小,且用户数据特征相似性也较低的情况。例如,两个不同城市,城市A中的银行和城市B中的商场,由于是两个不同的城市,其样本中涉及到的用户几乎为两个不同城市的人,交集较小。又因为一个是城市,一个是商场,两个数据集中的特征相似性较低,几乎为不同的用户特征。

 

联邦学习致力于在各个部门不共享各自数据的前提下,共同建立模型。

参考论文:Federated Machine Learning: Concept and Applications