0

为了改善训练模型的延迟,我尝试使用 Tensorflow 混合精度。

仅按照https://www.tensorflow.org/guide/mixed_precision中所述设置策略似乎并没有提高模型速度:

import tensorflow as tf

from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras import mixed_precision

policy = mixed_precision.Policy('mixed_float16')
mixed_precision.set_global_policy(policy)

但是当尝试使用其他 CNN 网络的玩具示例时,我发现如果我使用混合精度训练模型,速度会提高 x2 倍。

我试图避免使用混合精度重新训练模型,因为我使用的模型非常复杂,并且将其转换为适合混合精度的模型并非易事。

有没有办法将已经训练的模型转换为真正在混合精度模式下工作(当然获得混合精度加速)?

4

0 回答 0