0

我刚开始在 C# 环境中使用 ABBYY FineReader 引擎。我正面临一些法语 pdf 文档的识别问题。重音字符无法识别,有些单词似乎不尊重字典检查......这是我的代码:

loader = new FREngine.InprocLoader();
engine = loader.InitializeEngine("XXXXXXXXXXXXXXXXXX");

IRecognizerParams rp = engine.CreateRecognizerParams();
rp.SetPredefinedTextLanguage("French");

document = engine.CreateFRDocumentFromImage(@"D:\test.pdf");

document.Process();

document.Export(@"D:\test.docx", FREngine.FileExportFormatEnum.FEF_DOCX, null);

我怀疑用于识别的语言的法语配置被忽略了。您有任何想法如何以正确的方式设置它吗?

4

1 回答 1

0

它更适用于:

document = engine.CreateFRDocumentFromImage(@"D:\test.pdf");

DocumentProcessingParams dpp = engine.CreateDocumentProcessingParams();
dpp.PageProcessingParams.RecognizerParams.SetPredefinedTextLanguage("French");

document.Process(dpp);

似乎可以识别法语单词和重音字符。虽然结果不如 ABBYY 云解决方案...

于 2019-12-22T23:24:58.933 回答