0

我尝试过 textract ,我可以看到它提取了一些有趣的键值对。

我有一个图像数据集,每个数据集都用一组特定于域的键值对进行注释,这些键值对与 textract 找到的不同。

反正有没有让 textract 寻找我的键值对?是迁移学习的种类,还是工具的具体配置?

4

1 回答 1

0

不,没有办法改变 textract 如何预测文本或识别它们之间的关系。您可以继续添加您的图像和表单,并且 texttract 将(理论上)在它们上进行自我训练,但我怀疑它会有所帮助。您可以尝试获取检测到的原始文本并提出您自己的脚本以将它们置于关系中。请注意,textract 将返回检测到的原始文本,以便在图像/pdf 上找到它们。因此,很容易想出自己的逻辑来根据需要映射它们。

于 2020-02-12T10:39:18.333 回答