问题标签 [form-recognizer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
azure-logic-apps - blob 列表中的第一项到文件逻辑应用程序
我正在开发一个逻辑应用程序,当 blob 项目发生更改时,我想训练一个模型。我已经到了只想获取文件列表中的一项的地步(我只想建模以训练容器中的所有文件)。
我一直在搜索互联网,真的没有找到任何简单易懂的方法来实现我想做的事情。
有没有人有任何想法或资源来实现这一目标?
谢谢!迈克尔
microsoft-cognitive - Azure 表单识别器 - 模型版本控制
关于表单识别器 (FR) 模型管理的几个问题:
背景:我正在使用 FR Labeling 工具来训练模型和 C# Function 应用程序以与 FA 服务交互并分析表单。
- 每次训练模型时 - 都会创建一个新实例。新版本不包含对以前版本的任何引用,并且无法在代码中按名称选择模型。可以使用 TrainingCompletedOn 属性查询最新模型,但它不是防故障的,如果 FR 有多个项目,则不能使用。问题:如果正在进行持续开发并且模型不断改进 - 是否有方法(或最佳实践)来管理必须针对哪个模型。
- 与第一个 Q 相关——因为 FR 总是创建一个新模型——它最终会得到一大堆仍然处于活动状态的未使用模型。并且由于它们之间没有联系 - 没有安全的方法来执行清理。可以使用 API 删除旧模型,但这是一个手动过程。关于如何管理旧模型版本的任何建议?
- 可以将模型导出添加到版本控制并从版本控制部署到其他环境吗?有一个 API 端点可以在 FR 实例之间复制模型,但我想将它保存在版本控制中并从那里部署到环境中。
- 关于 Q3 - 在 DevOps 中管理 FR 项目的推荐做法是什么?如何在不同的环境中对工作进行版本控制和部署?
谢谢
containers - 使用 OCR 以键值格式从护照图像中提取数据
我的目标是使用基于 OCR 服务器的解决方案以键值格式从护照图像中提取数据,以便数据保留在本地。我尝试了 Azure 表单识别器容器(认知服务表单识别器 API V1 预览版)。但是结果并不令人满意,因为从训练数据创建的模型无法提取任何键值对。我尝试了各种训练样本数据,也参考了https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/build-training-data-set但没有用
您能否指导我如何以所需格式提取数据?
或者是否有任何人知道服务器产品、库或解决方案商业或开源甚至是.Net 中的任何其他方法,这可以帮助以下方面;
非常感谢任何帮助,谢谢
computer-vision - 表单识别器/计算机视觉 pbm 文件支持
我得到了一些带有 pbm 扩展名的文件(我被告知它是便携式位图图像文件)。
我在 Form Recognizer API 站点上注意到它不支持这种类型的文件。有谁知道它是否会得到支持,如果没有,有没有办法“轻松”将其转换为 tif?
提前致谢。迈克尔
form-recognizer - Azure 表单识别器。将 v1.0-preview 自定义模型迁移到 v2.0
我目前正在从表单识别器的 v1.0 预览版迁移到 v2.0,因为它已宣布将于 9 月 15 日弃用。我尝试使用我在 v1.0-preview 中训练的模型分析带有 v2.0 的 pdf,但响应是该模型不存在,所以我想我不能再使用旧模型了。我想知道是否可以将 v1.0-preview 的训练有素的自定义模型迁移到 v2.0,以便我可以使用它们而不必重新训练它们?
我可以看到有一个端点可以将经过训练的模型从一个订阅或区域复制到另一个订阅或区域,但没有提到在版本之间迁移模型。谢谢你。
azure - 使用表单识别器标签工具为表格添加标签
我试图标记表格,但这样做时表格将被显示。如果我点击键盘上相应数量的标签,它没有响应。如何标记检测到的表?
preview - How to access or activate public preview for Form Recognizer v2.1?
I would like to try the new feature to name a custom model and Model Compose like mentioned here: Form Recognizer v2.1 description. Now I am searching desperately for the way to get access to the public preview. Further do I have to upgrade my labling tool with a new image in a specific way to get access to the preview version?
python - 使用 Azure 表单识别器提取 PDF 表数据
我正在使用 Azure From Recognizer 处理发票处理项目。所有发票均为 PDF 格式。我正在使用带有标签的自定义表单识别器。我可以从 PDF 中提取一些数据,例如发票编号、发票日期、金额等,但我想使用 Azure 表单识别器从 pdf 中提取表格数据,但它没有正确读取表格。
我已经标记了我需要的单元格,当表中的行数增加时,它会正确读取该列,但它无法将每行的值彼此分开并将整列作为单个值返回。
我试图提供更多示例,但仍然无法检测到正确的表。 有没有办法使用 Azure 表单识别器从 PDF 中正确提取表数据?
扫描表格是我们的应用程序的基本要求,它将决定我们是否使用 Azure 表单识别器来构建我们的应用程序。
请参阅下面的 PDF 表格图像,并希望从所有列中提取所有行数据。
如果您可以通过一些文档为我们指明正确的方向,那将是有益的。
谢谢
azure - 已达到表单识别器用户的限制?
我目前正在运行一个表单识别器实例。我的一位同事也想看看表单识别器,但他给我发了这个链接。那里显示“已达到表单识别器容器用户的限制。我们目前不接受表单识别器容器的新应用程序。” 这是正确的还是文档已过时?