tensorflow - Tensorflow：量化的调整规则

Question

有没有办法实现以下流程： https ://www.tensorflow.org/performance/quantization

和电话： tf.contrib.quantize.create_eval_graph()

可以像下面的调用那样调整吗？

https://www.tensorflow.org/versions/master/api_docs/python/tf/quantize

我希望将权重缩放到具有对称范围的 8 位，精确的 0 和最大/最小值是幂 2，就像使用SCALED模式一样。例如，我更喜欢 -31 到 31 而不是 -10 到 30。即使 -10 到 30 会在 8 位时提供更好的分辨率，但准确的 0、对称性和范围作为 2 的幂对于 DSP 设备更为重要。

score 0 · Accepted Answer

TOCO(tf.lite.TocoConverter) 到目前为止还没有控制量化类型的选项，因为您实际上想要对称量化而不是非对称方法。但是，0.0 的实际值在量化期间保证是准确的。这意味着 0.0 映射到 uint8 q 没有任何舍入误差。

tensorflow - Tensorflow：量化的调整规则

1 回答 1

Related

Reference