1

当我使用分布式tensorflow时,grpc+gdr比grpc+verbs差,但是加载了nv_peer_mem,我不知道grpc+verbs和grpc+gdr的区别?任何人都可以帮助我吗?一些输出如下: root@s36-2288H-V5:~# /etc/init.d/nv_peer_mem status

nv_peer_mem 模块已加载。

我的起始代码如下:

python /root/benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py
--server_protocol=grpc+verbs
--model=vgg16 --variable_update=parameter_server
--batch_size=64 --num_batches=50 --num_warmup_batches=10
--local_parameter_device=gpu --num_gpus=1
--job_name=ps --task_index=0
--ps_hosts=172.168.30.25:10011
--worker_hosts=172.168.30.26:50012 &

当我设置 --server_protocol = grpc+gdr 时,性能更差。

4

0 回答 0