5

运行 Tesseract for English 时如何禁用字典更正?

我目前正在将 tesseract 作为子进程运行。

4

1 回答 1

9

尝试将这些变量(将它们放在配置文件中)设置为 false:

load_system_dawg 
load_freq_dawg
load_punc_dawg
load_number_dawg
load_unambig_dawg
load_bigram_dawg
load_fixed_length_dawgs

https://groups.google.com/forum/?fromgroups=#!searchin/tesseract-ocr/Disable$20dictionary$20​​in$20Tesseract/tesseract-ocr/5nvIo1DJxHE/f3gBi2pTKykJ

另请阅读如何增加对字典的信任/强度?在常见问题解答中。从中:

对于 tesseract-ocr < 3.01,尝试将 dict/permute.cpp 中的 NON_WERD 和 GARBAGE_STRING 提高到 3 甚至 5。

对于 tesseract-ocr >= 3.01,请尝试在配置文件中增加变量language_model_penalty_non_freq_dict_wordlanguage_model_penalty_non_dict_word 。默认情况下,它们分别为 0.1 和 0.15。

于 2013-01-18T20:55:00.607 回答