我正在使用 tensorflow 的 api 训练“faster_rcnn_inception_resnet_v2_atrous_coco”用于自定义对象检测。
我在 azure 上设置了一台机器,配置如下:
Intel cxeon CPU E5-2690 v3 @ 2.60GHz RAM 56GB windows10 64bit GPU tesla k80 总内存 11.18GB
当我运行 train.py 时,我每秒得到以下速度:
INFO:tensorflow:global step 458: loss = 0.5601 (3.000 sec/step) I1009 19:30:13.254615 5916 tf_logging.py:115] global step 458: loss = 0.5601 (3.000 sec/step) INFO:tensorflow:global step 459 : loss = 0.5724 (3.077 sec/step) I1009 19:30:16.331734 5916 tf_logging.py:115] global step 459: loss = 0.5724 (3.077 sec/step) INFO:tensorflow:global step 460: loss = 0.8615 (3.018 sec /step) I1009 19:30:19.350132 5916 tf_logging.py:115] 全局步骤 460: loss = 0.8615 (3.018 sec/step) INFO:tensorflow:global step 461: loss = 0.6021 (3.062 sec/step) I1009 19:30 :22.428256 5916 tf_logging.py:115] 全局步骤 461: loss = 0.6021 (3.062 sec/step)
它是否足够快,或者它应该更快,因为它使用的是 GPU?配置文件的批处理大小为 1。当我将其更改为 2 或更高时,它会耗尽内存。
在 93 张图像的数据集中,每步需要 3 秒。好的...但是在训练之后,当我加载冻结图并尝试对所有图像进行预测时,每张图像需要 1 秒.. 使用 GPU... 似乎太慢了.. 我做错了什么?