python - TensorFlow Keras 模型的量化感知训练

Question

我想用我的 keras 模型进行量化感知训练。我已经尝试过如下。我正在使用张量流 1.14.0

train_graph = tf.Graph()
train_sess = tf.compat.v1.Session(graph=train_graph)
tf.compat.v1.keras.backend.set_session(train_sess)

with train_graph.as_default():
    tf.keras.backend.set_learning_phase(1)
    model = my_keras_model()

    tf.contrib.quantize.create_training_graph(input_graph = train_graph, quant_delay=5)
    train_sess.run(tf.global_variables_initializer()) 

    model.compile(...)
    model.fit_generator(...)

    saver = tf.compat.v1.train.Saver()  
    saver.save(train_sess, checkpoint_path)

它可以正常工作。

但是，保存的模型（h5 和 ckpt）的大小与没有量化的模型完全相同。

这是正确的方法吗？我如何检查它是否量化好？

或者，有没有更好的量化方法？

score 1 · Accepted Answer

当您完成量化感知训练并将模型保存到磁盘时，它实际上还没有量化。换句话说，它是为量化“准备”的，但权重仍然是 float32。您必须进一步将模型转换为 TFLite 才能实际量化。您可以使用以下代码执行此操作：

converter = tf.lite.TFLiteConverter.from_keras_model(model)
converter.optimizations = [tf.lite.Optimize.DEFAULT]

quantized_tflite_model = converter.convert()

这将使用 int8 权重和 uint8 激活量化您的模型。

查看官方示例以供进一步参考。

python - TensorFlow Keras 模型的量化感知训练

1 回答 1

Related

Reference