我们正在尝试使用 38 个字符的较小字符集(文件)来训练注意力 OCR(FSNS) 。我们有自己的图像数据集,其性质与 FSNS 数据集相似。现在我们面临的问题是,即使经过四天的训练,损失也在不断增加,达到数千。但是如果我们使用默认的 charset 文件charset_size\=134.txt
,损失不会增加,我们得到字符准确度 ~= .80 和单词准确度 ~= .50。但是当我们使用 demo_inference.py 进行评估时,我们的模型会给出垃圾输出。我们没有使用 gpu。尝试了 TensorFlow 版本(1.2,1.3)。
有人可以帮助我们吗?