运行 Tesseract for English 时如何禁用字典更正?
我目前正在将 tesseract 作为子进程运行。
尝试将这些变量(将它们放在配置文件中)设置为 false:
load_system_dawg
load_freq_dawg
load_punc_dawg
load_number_dawg
load_unambig_dawg
load_bigram_dawg
load_fixed_length_dawgs
另请阅读如何增加对字典的信任/强度?在常见问题解答中。从中:
对于 tesseract-ocr < 3.01,尝试将 dict/permute.cpp 中的 NON_WERD 和 GARBAGE_STRING 提高到 3 甚至 5。
对于 tesseract-ocr >= 3.01,请尝试在配置文件中增加变量language_model_penalty_non_freq_dict_word和language_model_penalty_non_dict_word 。默认情况下,它们分别为 0.1 和 0.15。