machine-learning - 如何建立不平衡和小数据集的联邦学习模型

翻译自：https://stackoverflow.com/questions/71167600 2022-02-18T02:05:39.090

36 次

2

我正在使用 TFF 构建联邦学习模型，但我有一些问题：

我正在准备数据集，我有单独的数据文件，具有相同的特征和不同的样本。我会将这些文件中的每一个都视为一个客户端。我如何在 TFF 中维护它？
数据不平衡，这意味着每个文件的数据大小不同。这会影响建模过程吗？
数据量有点小，一个文件（客户端）有300条记录，另一个有1500条记录，是否适合建立联邦学习模型？

提前致谢

1 回答 1

1

您可以为数据集创建 ClientData，请参阅使用 tff 的 ClientData。
数据集不必平衡即可构建联邦学习模型。在https://arxiv.org/abs/1602.05629中，服务器对客户端的模型更新进行加权联合平均，其中权重是每个客户端拥有的样本数。
每个客户端的几百条记录不亚于EMNIST 数据集，这样就可以了。关于客户端总数：本教程展示了 10 个客户端的 FL，您可以运行较小的 colabNUM_CLIENTS以查看它在示例数据集上的工作方式。

于 2022-02-18T18:45:11.320 回答