我正在尝试加快人员计数器应用程序的推理速度,为了使用 GPU,我已按说明设置了推理引擎配置设置:
device_name = "GPU"
ie.SetConfig({ {PluginConfigParams::KEY_CONFIG_FILE, "./cldnn_global_custom_kernels/cldnn_global_custom_kernels.xml"} }, device_name);
并在推理引擎上加载网络我已经设置了目标设备,如下所述:
CNNNetwork net = netReader.getNetwork();
TargetDevice t_device = InferenceEngine::TargetDevice::eGPU;
network.setTargetDevice(t_device);
const std::map<std::string, std::string> dyn_config = { { PluginConfigParams::KEY_DYN_BATCH_ENABLED, PluginConfigParams::YES } };
ie_.LoadNetwork(network,device_name, dyn_config);
但是推理引擎尚未使用 CPU,这会减慢推理时间。有没有办法以最大功率使用英特尔 GPU 在特定网络上进行推理?我正在使用 person-detection-retail-0013 模型。
谢谢。