我正在训练一个我想在量化的 8 位环境(微控制器)中使用 TFLite 部署的 Keras 模型。为了提高量化性能,我进行了量化感知训练。然后,我使用我的验证集作为代表性数据集创建量化的 TFLite 模型。使用验证集评估性能并在此图像中说明:
如果不是简单地从 QA 训练的模型(图中的红色)生成 TFLite 模型(图中的青色),我将权重从 QA 训练的模型复制到原始模型,然后生成 TFLite 模型以解决问题(图中的紫色),这给出了稍微不同的预测。这是为什么?
我知道 TFLite 模型与 QA 训练的模型略有不同,因为转换使用基于验证集的训练后量化。但是如果网络的结构、权重和偏差相同,量化不应该相同吗?
子问题:为什么 TFLite 模型平均比正常的 Keras 模型略差?由于我正在对验证集进行量化和评估,如果有的话,我希望它能够人为地表现得更好。