2

我试图了解使用预建发票模型不支持的语言(例如法语)为发票训练自定义模型的最佳方法是什么。

正常情况下,我们将有来自不同供应商的许多不同发票布局,但在所有这些布局中,我们将提取相同的标签集(发票编号、金额、日期、供应商名称等)。

我应该为每个供应商创建一个模型并进行组合吗?如果我这样做,我是否需要为所有供应商培训它,或者它是否适用于未经培训但使用与经过培训的发票相同的措辞的发票?

4

2 回答 2

2

如果您只想获取发票编号、金额、日期等几个字段。您可以尝试预先构建的发票,看看它是否提取了您需要的数据。它还没有接受过法语或其他语言发票的培训,质量应该较低,但可能会起作用。如果您正在训练自定义模型,则需要为每个提供者训练一个模型,然后将所有单个模型组合成一个组合模型。我建议您选择顶级供应商并为他们创建模型。

于 2021-04-26T17:00:50.903 回答
1

我在 MS QA 网站上得到了 Microsoft 的答复,见下文:
“对于发票(我相信他的意思是英文发票),您应该使用预先构建的 Invoice 模型,无需培训 - https://docs.microsoft.com/en -us/azure/cognitive-services/form-recognizer/concept-invoices
如果您需要训练模型而不使用预先构建的模型而不是使用每个供应商\提供商的模型并组合它们。从顶级提供商开始,这样你得到更多的报道。”

查找有关MS QA 问题的更多信息。

于 2021-05-04T12:02:31.383 回答