2

我正在使用 TFF 构建联邦学习模型,但我有一些问题:

  1. 我正在准备数据集,我有单独的数据文件,具有相同的特征和不同的样本。我会将这些文件中的每一个都视为一个客户端。我如何在 TFF 中维护它?

  2. 数据不平衡,这意味着每个文件的数据大小不同。这会影响建模过程吗?

  3. 数据量有点小,一个文件(客户端)有300条记录,另一个有1500条记录,是否适合建立联邦学习模型?

提前致谢

4

1 回答 1

1
  1. 您可以为数据集创建 ClientData,请参阅使用 tff 的 ClientData
  2. 数据集不必平衡即可构建联邦学习模型。在https://arxiv.org/abs/1602.05629中,服务器对客户端的模型更新进行加权联合平均,其中权重是每个客户端拥有的样本数。
  3. 每个客户端的几百条记录不亚于EMNIST 数据集,这样就可以了。关于客户端总数:本教程展示了 10 个客户端的 FL,您可以运行较小的 colabNUM_CLIENTS以查看它在示例数据集上的工作方式。
于 2022-02-18T18:45:11.320 回答