1) 您可以使用NVIDIA-DIGITS应用程序来监控您的网络。它们提供了一个 GUI,包括数据集准备、模型选择和学习曲线可视化。此外,他们使用允许多 GPU 训练的 caffe 分布。
2)或者,您可以简单地使用 caffe 中的日志解析器。
/pathtocaffe/build/tools/caffe train --solver=solver.prototxt 2>&1 | tee lenet_train.log
这允许您将火车日志保存到“lenet_train.log”中。然后通过使用:
python /pathtocaffe/tools/extra/parse_log.py lenet_train.log .
您将训练日志解析为两个 csv 文件,其中包含训练和测试损失。然后,您可以使用以下 python 脚本绘制它们
import pandas as pd
from matplotlib import *
from matplotlib.pyplot import *
train_log = pd.read_csv("./lenet_train.log.train")
test_log = pd.read_csv("./lenet_train.log.test")
_, ax1 = subplots(figsize=(15, 10))
ax2 = ax1.twinx()
ax1.plot(train_log["NumIters"], train_log["loss"], alpha=0.4)
ax1.plot(test_log["NumIters"], test_log["loss"], 'g')
ax2.plot(test_log["NumIters"], test_log["acc"], 'r')
ax1.set_xlabel('iteration')
ax1.set_ylabel('train loss')
ax2.set_ylabel('test accuracy')
savefig("./train_test_image.png") #save image as png