问题标签 [ctc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
keras - 无效参数:在空标签后面看到一个非空标签(索引 >= num_classes - 1)
我在进行 CTC 培训时遇到以下错误:
InvalidArgumentError:找到 2 个根错误。(0)无效参数:看到一个非空标签(索引> = num_classes - 1)跟随一个空标签,批次:0 num_classes:40标签:35,4,6,18,8,36,29,37,38到目前为止看到的,39,40,0 个标签:35,4,6,18,8,36,29,37,38 [[node CTC-MODEL/ctc/CTCLoss (defined at :18)]] (1) 无效参数:在空标签之后看到一个非空标签(索引> = num_classes - 1),批次:0 num_classes:40标签:35,4,6,18,8,36,29,37,38,39,40 ,0 个标签到目前为止看到:35,4,6,18,8,36,29,37,38 [[node CTC-MODEL/ctc/CTCLoss (defined at :18)]] [[gradient_tape/CTC-MODEL/ ctc/Shape/_72]] 0 次成功操作。0 派生错误被忽略。[操作:__inference_train_function_12365]
python - 无效参数:目标转换序列的时间不足
我试图运行这个 HTR 模型https://github.com/arthurflor23/handwritten-text-recognition
,但它给了我这个错误Invalid argument: Not enough time for target transition sequence
。问题,我认为在ctc_batch_cost
. 我的图像尺寸是(137,518),文本的 max_len 是 137。关于如何解决这个问题的任何想法?
training-data - 将 mfcc 特征与训练标签相结合
我正在使用 CTC 执行语音识别模型。我应该如何将 mfcc 功能与训练标签结合起来,因为标签是独立于时间步长(音频转录本)的完整句子,而 mfccs 取决于时间步长。
python - 加载保存的 CTC Loss CNN+RNN 模型的权重预测加载后交换的类
https://keras.io/examples/vision/captcha_ocr/
我使用的是我自己的数据集,但我使用的模型实际上与上面那个 URL 中的模型相同。
它工作得非常好,但是,我的问题是在保存模型后使用:
model.save('mymodel')
然后使用以下方法重新加载它:
类标签是随机混合的。
例如,假设它在训练后预测标签:
AB352
但是当重新加载保存的模型时,它会预测如下:
YZ648
其中对于 A 的所有实例,它将开始预测 Y,对于 3 的所有实例,它将预测 6。
这很烦人,我不知道为什么会这样。
keras - 如何将 decode_batch_predictions() 方法添加到 Keras Captcha OCR 模型中?
当前的Keras Captcha OCR 模型返回一个 CTC 编码的输出,需要在推理后进行解码。
要对此进行解码,需要在推理之后作为单独的步骤运行解码实用程序函数。
解码后的效用函数使用keras.backend.ctc_decode
,而后者又使用贪婪或波束搜索解码器。
我想使用 Keras 训练一个 Captcha OCR 模型,该模型返回解码后的 CTC 作为输出,而无需在推理后进行额外的解码步骤。
我将如何实现这一目标?
python - CNN-LSTM 无法与 CTC 损失收敛
我想使用 ResNet50-LSTM 训练一个 LPR(车牌识别)模型来识别中国车牌。首先,我随机使用十个省份的车牌,模型在一个epoch内可以很好地收敛,但是当我在训练数据集中再添加一个省份时,无论哪个省份,它都无法收敛。每个省有2000张图片,如下图:train dataset pics
该模型
数据加载器:
训练代码:</p>
这让我困惑了很长时间。有人知道为什么会这样吗?非常感谢您的帮助!
ctc - ctc 错误 ignore_longer_outputs_than_inputs
我收到此错误:'''
'''
这是我正在使用的代码,我可以把这个参数ignore_longer_outputs_than_inputs放在哪里?
'''
'''
python - 用于从 Keras 读取验证码的 OCR 模型作者:A_K_Nain
我正在为 colab 中的 Kaggle 应用于 word mnist 数据集的 OCR 模型工作。我受到来自 ocr 验证码的模型的启发,该模型具有由 A_K_Nain 在站点托管的 Keras 示例中编写的 LSTM 和 CTC 层:https ://keras.io/examples/vision/captcha_ocr/
它对我有用。但现在我在编码和解码字符到数字时遇到了很多问题。我试图在ocring captcha网站上编译模型,我发现了同样的问题。任何人都可以解释是什么问题以及是否有解决问题的方法。
我认为问题出在以下代码中:
将字符映射到整数
将整数映射回原始字符
这可能会给他的职能带来一些问题。
python - 保存 OCR 模型以从 Keras 读取验证码作者:A_K_Nain
我正在为 colab 中的 Kaggle 应用于 word mnist 数据集的 OCR 模型工作。我受到来自 ocr 验证码的模型的启发,该模型具有由 A_K_Nain 在站点中托管的 Keras 示例中编写的 LSTM 和 CTC 层:https ://keras.io/examples/vision/captcha_ocr/ 我想保存模型但是当我尝试保存时加载它以对看不见的数据进行预测。我收到未知 CTClayer 的错误。ctclaer 不是在模型内部而是在模型外部定义的问题,所以当我尝试加载模型时,我会遇到错误。我找到了使用自定义模型的解决方案,但对我没有任何作用。如何保存托管在以下站点中的模型:https ://keras.io/examples/vision/captcha_ocr/