TensorFlow (TF) 和 TensorFlow Federated (TFF) 是不同的功能层,旨在很好地协同工作(顾名思义)。


我想知道以原始 TF 和 TFF 工作负载都可以使用的方式来描述计算的最佳方式是什么,以及人们可能想要避免的那种陷阱。


好问题。实际上,至少有 3 种方法可以组合 TensorFlow 代码以与 TFF 一起使用,每种方法都有自己的优点。

  1. 使用 TensorFlow 的组合机制 (defuns) 是推荐的方式,假设它适用于您的特定情况。TensorFlow 已经有了编写代码的机制,我们不想重新发明轮子。我们在 TFF (@tff.tf_computation) 中创建自己的组合机制的原因是为了处理特定的限制(例如,在 TF 中缺乏对接口级别的数据集的支持,以及 TF 组件需要与TFF 的其余部分),理想情况下,我们会将这种机制的使用限制在真正需要它的情况下。

如果可能,使用 @tf.function 装饰 TensorFlow 组件,并仅在顶层将整个 TensorFlow 块包装为 @tff.tf_computation,然后将其嵌入到 @tff.federated_computation 中。这样做的众多好处之一是它允许您使用标准 TensorFlow 工具测试 TFF 之外的组件。


  1. 使用 Python 的组合机制(普通未修饰的 Python 函数)也是一个不错的选择,尽管它不如 (1) 可取,因为它只会导致在定义时将一个代码体嵌入到另一个代码体中,因为 TFF 会跟踪所有 TFF - 修饰的 Python 函数来构造要执行的计算的序列化表示,而不会为您提供隔离或任何其他特殊好处。

您可能仍希望使用此模式来允许在 TFF 之外或在 (1) 或 (3) 都不起作用的情况下测试您的组件。

因此,如果 (1) 不起作用,您应该首先考虑以下替代方案:

  1. 不建议使用 TFF 的组合机制 (@tff.tf_computation),除非 - 如上所述 - 在需要它的情况下,例如当 TensorFlow 组件需要接受数据集作为参数时,或者它只被调用时来自@tff.federated_computation。请记住,TFF 对作为参数的数据集的支持仍处于试验阶段,虽然在某些情况下它可能是唯一的解决方案,但您仍可能遇到问题。您可以期待实现的发展。


