我在最左边有一列数字作为我的键,其中每个条目都有 5 个我试图与之配对的设计值。为了训练模型,我使用了 15 个完整的 pdf 文件,其中大部分不是扫描的。我还编辑了其中的 3 个,删除了值但保留了键,并将它们保存为与原始文件名相同的文件名,后缀为“Empty”。从模型返回的结果可以毫无问题地找到任何数字或其位置,但它们不在任何类型的键值对中。我得到这个键值“对”排除了获取列标题和行的任何可能性,但只有行和相对于其他行的位置会让事情变得足够简单。只是希望对如何训练它以重用与在行中看起来相同的键有所了解。
我将数据导出为 Word 格式并用浅色边框将值制成表格。我没有机器学习的经验。对于空表单,将 DocVariable 字段添加到 5 个值列中的每一列是否有任何好处,变量名称是行键名称和列键名称的组合?