有没有办法实现以下流程: https ://www.tensorflow.org/performance/quantization
和电话:
tf.contrib.quantize.create_eval_graph()
可以像下面的调用那样调整吗?
https://www.tensorflow.org/versions/master/api_docs/python/tf/quantize
我希望将权重缩放到具有对称范围的 8 位,精确的 0 和最大/最小值是幂 2,就像使用SCALED模式一样。例如,我更喜欢 -31 到 31 而不是 -10 到 30。即使 -10 到 30 会在 8 位时提供更好的分辨率,但准确的 0、对称性和范围作为 2 的幂对于 DSP 设备更为重要。