1

我对 CNTK 很陌生。我想使用 CNTK - ResNet/Fast-R CNN 训练一组图像(以检测酒精眼镜/瓶子等物体)。

我正在尝试遵循来自 GitHub 的以下文档;然而,这似乎不是一个直接的过程。https://github.com/Microsoft/CNTK/wiki/Object-Detection-using-Fast-R-CNN

我找不到合适的文档来为不同大小和形状的图像生成 ROI。以及如何根据训练好的模型创建对象标签?有人可以指出我可以在cntk模型上工作的正确文档或培训链接吗?请参阅附件图像,其中我能够在脚本中加载具有默认 ROI 的示例图像。如何正确设置图像中对象的大小和标签?提前致谢!

为训练加载的示例图像

4

2 回答 2

0

有人可以指出我可以在cntk模型上工作的正确文档或培训链接吗?

您可以查看我在 GitHub 上的存储库

它将指导您完成使用 CNTK 训练您自己的对象检测和分类模型所需的所有步骤。

但简而言之,正确的步骤应该如下所示:

  1. 设置环境
  2. 准备数据
  3. 标记图像(基本事实)
  4. 下载预训练模型并为您的自定义数据集创建映射
  5. 跑步训练
  6. 在测试集上评估模型
于 2017-11-02T23:24:53.027 回答
0

不确定您所说的正确文档是什么意思。这是论文的一个实现(https://arxiv.org/pdf/1504.08083.pdf)。看起来您正在尝试生成投资回报率。您能否查看网站上记录的帮助函数以解析您可能需要的内容:

要运行玩具示例,请确保在 PARAMETERS.py 中将 datasetName 设置为“grocery”。

  • 运行A1_GenerateInputROIs.py以生成用于训练和测试的输入 ROI。

  • 运行A2_RunCntk_py3.py以使用 CNTK Python API 训练 Fast R-CNN 模型并计算测试结果。

该算法将在几个候选区域上工作,然后生成输出:一个用于对象类,另一个用于为属于这些类的对象生成边界框。请参阅代码以获取实现的详细信息。

于 2017-04-09T19:05:27.083 回答