1

我目前正在使用 Finereader 11 SDK 开发一个小项目。为了改善我的结果,我喜欢使用临时词典。字典的内容是根据某行的第一个词

例子:

Samsung Galaxy S3 ... many other word in this line
Apple Iphone 4 ... much more words
some more lines

我的想法是识别第一个单词(Samsung 或 Apple),并根据第一个单词(三星:Galaxy、S3、...)用所有可能的单词填充字典

知道如何用 Finereader 解决这个问题

问候

4

1 回答 1

2

谢谢你的澄清。所以这就是我认为你可以做的事情。这适用于 FineReader 产品线,当然在 SDK 中您可以通过 API 进行更具体的控制。

FineReader OCR 有以下字典:

  • 内置字典 - 大量常用词及其变体,这是 ABBYY OCR 技术的优势之一。它不包含专门的词,例如“Samsung”和“S3”。通过选择流行语言,您会自动打开该语言的内置词典。

  • 自定义词典 - 这是您可以构建的词典,单独使用或与内置词典结合使用。

所以对于你的项目,我相信使用内置字典是有意义的,因为你的短语可能有标准的英语单词(你没有提供完整的短语让我看,所以你自己决定)。

我也坚信您需要创建一个包含品牌和型号等的自定义字典。如果您有这个选项,并且听起来像您这样做。它将大大提高识别率,尤其是对于非自然词,如“S3”,因为常用语言规则表示字母和数字不应混合。这很容易做到。

我目前看不到用单独的字典阅读每一行的好处,除非你相信你会有适用于不同行的非常相似的单词的交集,并且你希望这些单词在单独的字典中并且相对于每一行。然后您可以创建单独的字典,并根据初始单词打开每个字典进行二次识别。但是,要实现这一点,您需要首先分成几行(在内存中,或实际裁剪图像),以便能够使用唯一的字典分别处理每一行。这只有在具有大量工作的 SDK 中才有可能。

于 2014-08-06T06:01:52.747 回答