我们可以使用不同的 CPU 架构(和后端)来训练(校准)和推断量化的 pytorch 模型吗?
我发现的有关此主题的唯一帖子指出:
静态量化必须在与您的部署目标具有相同架构的机器上执行。如果您使用 FBGEMM,则必须在 x86 CPU 上执行校准过程;如果您使用的是 QNNPACK,则需要在 ARM CPU 上进行校准
但是官方文档中没有关于此的内容。
我们可以使用不同的 CPU 架构(和后端)来训练(校准)和推断量化的 pytorch 模型吗?
我发现的有关此主题的唯一帖子指出:
静态量化必须在与您的部署目标具有相同架构的机器上执行。如果您使用 FBGEMM,则必须在 x86 CPU 上执行校准过程;如果您使用的是 QNNPACK,则需要在 ARM CPU 上进行校准
但是官方文档中没有关于此的内容。