我正在尝试使用uber 的 horovod library运行在 GPU 上运行的 tensorflow 神经网络。同时,我正在尝试运行一个测量脚本来测量多个gpus之间的 nvlink。唉,每当我运行文件时,我都会收到以下错误:
tensorflow.python.framework.errors_impl.NotFoundError:/home/pat/.virtualenvs/venv/lib/python3.6/site-packages/horovod /tensorflow/mpi_lib.cpython-36m-x86_64-linux-gnu.so:未定义符号: _ZN10tensorflow14kernel_factory17OpKernelRegist rar12InitInternalEPKNS_9KernelDefEN4absl11string_viewESt10unique_ptrINS0_15OpKernelFactoryESt14default_deleteIS8_EE
有谁知道如何解决这个问题?
谢谢你。