我在stackoverflow上阅读了一些关于attention-ocr的问题,其中大部分是关于特定步骤的实现细节。我想知道的是我们在自己的数据集上微调这个模型的管道。
据我所知,步骤应该是:
0)我们应该先下载FSNS数据集吗?我试图绕过这一步并尝试仅在一张图像上运行推理,但它总是给我错误:“ImportError: No module named 'fsns”。所以我想知道一旦我设置了自己的数据集,这个错误是否会消失。
1) 以与 FSNS 相同的格式存储我们的数据。(本主题链接:如何创建与FSNS数据集格式相同的数据集?</a>,如何为google tensorflow attention ocr创建自定义数据集?)
2)下载预训练的检查点(http://download.tensorflow.org/models/attention_ocr_2017_08_09.tar.gz)
3)以某种方式修改“model.py”以适合您自己的目的。
4)以某种方式修改“train.py”以使用 tensorflow 服务训练您自己的模块。
我现在仍处于这个项目的早期阶段(创建自己的数据集),并且对如何做以及下一阶段是什么感到困惑。