0

我是 Digits 和 TX2 的新手。我正在尝试使用以下教程创建对象检测模型:https ://github.com/dusty-nv/jetson-inference

我成功创建了数据集。问题出在模型上

在创建模型时,我收到以下错误。

    Memory required for data: 3268934784
    creating layer bbox_loss        
    Creating Layer bbox_loss
    bbox_loss <- bboxes-obj-masked-norm
    bbox_loss <- bbox-obj-label-norm
    bbox_loss -> loss_bbox
    Setting up bbox_loss
    Top shape: (1)
    with loss weight 2
    Memory required for data: 3268934788
    Creating layer coverage_loss
    Creating Layer coverage_loss
    coverage_loss <- coverage_coverage/sig_0_split_0
    coverage_loss <- coverage-label_slice-label_4_split_0
    coverage_loss -> loss_coverage
    Setting up coverage_loss
    Top shape: (1)
    with loss weight 1
    Memory required for data: 3268934792
    Creating layer cluster

左边的作业目录信息为:

Job Directory
/home/nvidia/DIGITS/digits/jobs/20180816-161051-e67a
Disk Size
0 B
Network (train/val)
train_val.prototxt
Network (deploy)
deploy.prototxt
Network (original)
original.prototxt
Solver
solver.prototxt
Raw caffe output
caffe_output.log
Pretrained Model
/home/nvidia/bvlc_googlenet.caffemodel.4
Visualizations
Tensorboard

服务器上的错误是

2018-08-16 16:10:53 [20180816-161051-e67a] [INFO ] Task subprocess args: "/home/nvidia/Caffe/caffe/build/tools/caffe train --solver=/home/nvidia/DIGITS/digits/jobs/20180816-161051-e67a/solver.prototxt --gpu=0 --weights=/home/nvidia/bvlc_googlenet.caffemodel.4"
2018-08-16 16:11:00 [20180816-161051-e67a] [ERROR] Train Caffe Model task failed with error code 1

我不知道如何释放内存,因为我在作业目录中有超过 2 GB 的可用空间。请帮我。提前致谢。

4

1 回答 1

0

最近几天遇到了同样的问题,也许将来会对某人有所帮助。首先,确保您拥有正确版本的 protobuf。您可以通过以下方式进行检查:

protoc --version 

如果是 2.*,您必须更新到 3.*,例如按照此处列出的方式构建它https://github.com/NVIDIA/DIGITS/blob/digits-6.0/docs/BuildProtobuf.md,然后重新构建咖啡。另外,请确保您拥有兼容版本的 protobuf 的 pip 包。对我来说,以下版本现在适用于教程https://github.com/dusty-nv/jetson-inference中的 Digits 和 Caffe :

pip install --user --upgrade protobuf==3.1.0.post1
于 2018-11-07T18:36:27.843 回答