1

我正在尝试使用 MxNet Framework 使用 /mxnet/example/image-classification/symbols 目录中的 alexnet 代码。我不是人工智能方面的专家。有人能解释一下如何使用 GPU 运行它吗?我为单个 GPU 尝试了以下方法:

python alexnet.py --network resnet --num-layers 110 --batch-size 128 --gpus 0

它什么也没做。我有高性能计算背景。我想测试每个节点和跨节点(分布式)的这个框架的可扩展性。任何帮助,将不胜感激。

谢谢,

4

1 回答 1

2

alexnet.py(以及示例/图像分类/符号文件夹中的其他 Python 文件)仅返回代表网络的符号。

首先下载并解压缩您的数据集:

/mxnet/example/image-classification/data# wget http://www.image-net.org/image/whatever-zip-or-tar-file
/mxnet/example/image-classification/data# unzip whatever-zip-or-tar-file

将数据格式转换为 RecordIO:

/mxnet/example/image-classification/data# python ../../../tools/im2rec.py --list True --recursive True --train-ratio 0.95 mydata tiny-imagenet-200
/mxnet/example/image-classification/data# python ../../../tools/im2rec.py --num-thread 16 mydata tiny-imagenet-200

使用 train_imagenet.py 脚本在 alexnet 上进行训练(如果您愿意,可以切换到任何其他符号):

/mxnet/example/image-classification/data# cd ..
/mxnet/example/image-classification# python train_imagenet.py --network alexnet --data-train /mxnet/example/image-classification/data/mydata_train.rec --data-val /mxnet/example/image-classification/data/mydata_val.rec --num-layers 110 --batch-size 64 --gpus 0

查看README以了解更多详细信息。

于 2017-06-16T20:38:16.563 回答