联邦学习笔记（三）

时间 2021-01-08 标签联邦学习

本文首发于Feng Yu的空间 https://yu-feng.top/

写在前面

参考文献《Federated Learning: Challenges, methods, and future, 2020》，较为详细的介绍当前FL的挑战和解决方法以及未来可能的研究方向或切入点。

Federated Learning: Challenges, methods, and future

摘要

联邦学习在保持数据本地化的同时涉及在远程设备或孤立的数据中心（例如手机或医院）上训练统计模型。在异构网络和潜在大规模网络中进行训练带来了新的挑战，这些挑战要求从根本上区别于大规模机器学习，分布式优化和隐私保护数据分析的标准方法。在本文中，我们讨论了联邦学习的独特特征和挑战，提供了当前方法的广泛概述，并概述了未来的几个方向

因为设备（智能手机、可穿戴设备和自动驾驶车辆）计算力的上升以及对隐私信息转移的担忧，所以将数据保存于本地和网络计算边缘化变得更加有吸引力。 ==>> 边缘计算

正因为在分布式网络下这些设备的存储和计算能力使得利用每台设备上的增强(enhanced)本地资源成为可能，此外，用户隐私信息保存于本地避免了隐私担忧。 ==>> 联邦学习

FL的应用

智能手机
- 单词联想《A. Hard, K. Rao, R. Mathews, F. Beaufays, S. Augenstein, H. Eichner, C. Kiddon, and D. Ramage, Federated learning for mobile keyboard prediction. 2018. [Online]. Available: arXiv:1811.03604》
- 挑战：用户为了保护个人隐私可能不愿意分享数据或者节省手机有限的带宽/电量
- FL有潜力在不损害用户体验或泄露隐私信息前提下在智能手机上启用预测功能
组织机构 --医疗机构
- L. Huang, Y. Yin, Z. Fu, S. Zhang, H. Deng, and D. Liu, LoAdaBoost: Loss-based adaboost federated machine learning on medical data. 2018. [Online]. Available: arXiv:1811.12629
物联网-- 可穿戴设备、自动驾驶车辆、智能家居

FL方法在公司的应用

K. Bonawitz, H. Eichner, W. Grieskamp, D. Huba, A. Ingerman, V. Ivanov, C. Kiddon, J. Konecnyet al., “Towards federated learning at scale: System design,” in Proc. Conf. Machine Learning and Systems, 2019.
M. J. Sheller, G. A. Reina, B. Edwards, J. Martin, and S. Bakas, “Multi-institutional deep learning modeling without sharing patient data: A feasibility study on brain tumor segmentation,” in Proc. Int. MICCAI Brainlesion Workshop, 2018, pp. 92–104. doi: 10.1007/978-3-030 -11723-8_9.

隐私敏感应用

T. S. Brisimi, R. Chen, T. Mela, A. Olshevsky, I. C. Paschalidis, and W. Shi, “Federated learning of predictive models from federated electronic health records,” Int. J. Medical Informatics, vol. 112, Apr. 2018, pp. 59–67. doi: 10.1016/j.ijmedinf.2018.01.007
L. Huang, Y. Yin, Z. Fu, S. Zhang, H. Deng, and D. Liu, LoAdaBoost: Loss-based adaboost federated machine learning on medical data. 2018. [Online]. Available: arXiv:1811.12629

挑战

目标:

m表示总设备数量，p_k>=0 且 SUM(p_k)=1，F_k为第k个设别的本地目标函数

昂贵的通信费用
- 为了使模型适用于联邦网络中设备产生的数据，需要开发通信效率高的方法，该方法可以迭代地发送small message或者将模型更新作为训练过程的一部分，而不是通过网络发送整个数据集
- 进一步减少这种设置下的通信，需要考虑两个关键方面
  - 减少通信回合总数量
  - 减少每个回合发送信息的大小
系统异质性

由于硬件（CPU和内存）、网络连接（3G、4G、5G、WiFi）、能量（电池等级）的差异，因此联邦网络中每个设备的存储、计算和通信能力都各不相同
- 系统级别的特性极大地加剧了诸如straggler mitigation和容错（fault tolerance）之类的挑战；
- 已进行的FL方法有
  - 预计参与人数少
  - 容忍异质的硬件
  - 通信网络中足够坚固以防设备掉落
统计异质性

设备经常以高度不相同的方式在网络上生成和收集数据
- [42]《V. Smith, C.-K. Chiang, M. Sanjabi, and A. Talwalkar, “Federated multi-task learning,” in Proc. Advances in Neural Information Processing Systems, 2017, pp. 4424–4434》数据生成范例违反了分布式优化中经常使用的独立且均匀分布（i.i.d.）的假设，可能会增加问题建模，理论分析和解决方案的经验评估方面的复杂性
- 多任务学习和元学习都支持个性化或特定于设备的建模，这通常是一种更自然的方法来处理数据的统计异构性，以实现更好的个性化
隐私问题
- 安全多方计算SMC
- 差分隐私DP
- 以上方法通常以减少模型表现或系统高效性为代价换取隐私保护，因此平衡两者关系是一个挑战

未来研究方向

极致的通信方案
- 尽管在传统的数据中心环境中已经探索了单次或分而治之的通信方案[29]，但是在大规模和统计异构网络中，这些方法的行为还没得到很好的理解
通信减少与the Pareto frontier
- 联邦训练中减少通信的方法有本地更新和模型压缩，了解这些技术之间的相互关系以及系统分析每种方法的准确性和通信之间的权衡很重要
- 有效的神经网络推理对于FL通信减少技术中是有必要的
新颖的异步模型
- 批量同步方法
- 异步方法（假定延迟有限）
异质性诊断

开放性问题：
- 是否有简单的诊断方法可以快速地预先确定联邦网络中的异质性水平？
- 是否可以开发类似的诊断方法来量化与系统相关的异质性数量？
- 是否可以利用当前或新的异质性定义来设计新的经验和理论上具有改进收敛性的联邦优化方法？
细颗粒隐私限制

在实践中，隐私约束可能在设备之间甚至单个设备的数据点之间都不同，因此有必要将隐私问题细分
- sample-specific privacy[24]《J. Li, M. Khodak, S. Caldas, and A. Talwalkar, “Differentially private meta-learning,” in Proc. Int. Conf. Learning Representations, 2020》
- device-specifiv privacy
超越监督学习之外的
生产化联邦学习

除了本文讨论的主要挑战之外，在生产环境中运行联合学习时还存在许多实际问题。尤其是诸如概念漂移（当基础数据生成模型随时间变化时），昼夜变化（当设备在一天或一周的不同时间表现出不同的行为）之类的问题[14]，以及冷启动问题（当新设备进入网络时）必须小心处理。

[5]《K. Bonawitz, H. Eichner, W. Grieskamp, D. Huba, A. Ingerman, V. Ivanov, C. Kiddon, J. Konecnyet al., “Towards federated learning at scale: System design,” in Proc. Conf. Machine Learning and Systems, 2019.》讨论了生产联邦学习系统中存在的一些与系统相关的实用问题

总结

与传统的分布式数据中心计算和经典的隐私保护学习相比，讨论了联邦学习的独特性质和相关挑战。提供了关于经典结果的广泛调查以及针对联邦环境的最新工作。最后，概述了一些有待进一步研究的未解决问题。提供这些问题的解决方案将需要众多研究社区的跨学科研究。

参考文献

[1] Federated Learning: Challenges, methods, and future, 2020

–fzhiy.更新于2020年9月2日16点51分