问题标签 [amazon-textract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.net - 如何解决“AmazonTextractException:请求中包含的安全令牌无效”错误?
我编写了一小段 .NET Core 代码来与 Amazon Textract API 交互。代码本身很小,在我的一台开发机器上运行良好。该代码不使用凭证做任何事情,一切都是通过 AWS CLI 配置的。当我在其他开发机器上运行相同的代码时,我收到以下错误:
AmazonTextractException:请求中包含的安全令牌无效
到目前为止,这是我尝试过的:
创建一个新的 AWS 密钥/密钥对,删除任何先前存在的环境变量(AWS_SECRET_KEY 等),删除
~\.aws\config
和~\.aws\credentials
. 使用新凭证重新运行 aws configure。同样的例外。再次执行上述清理步骤后,重新使用在一台开发机器上工作的相同 AWS 密钥/密钥对。
确保在 AWS 账户上关闭了 MFA
两台机器之间的~\.aws\config
和~\.aws\credentials
是相同的。
在一台机器上,我的代码运行良好,它使用 OCR 从我的文档中提取文本。在另一台机器上,它会导致此错误:
Amazon.Textract.AmazonTextractException:请求中包含的安全令牌无效
考虑到配置,我希望代码在每个系统上以相同的方式工作。
这台机器上还有什么可能导致事情表现不同?是否有任何其他我不知道的秘密 AWS 设置,或者在某些系统上可能需要任何其他步骤?
python - 有没有办法将 AWS Textract 中的键值对作为 JSON 或 CSV 保存到 S3 存储桶?
我在 AWS 和 Python 上慢慢地学习东西,我一直在关注这个例子:
更具体地说,表格提取位接近尾声。
而且我想如果我使用 Lambda 函数执行整个过程,其中触发器是 S3 图像输入,有没有办法将 Analyse_Document 函数产生的键值对保存为 json 或 CSV 相同S3 存储桶?
这是我的代码:
我之前能够生成一个文本文件,但现在我已经更改了代码以获取 CSV 或 JSON(对于 DynamoDB),我无法做到这一点。帮助?
python - 将打印输出保存为 dict 或 JSON
我有以下将 boto3 用于 AWS 的代码。
我正在尝试将该函数的输出保存为 dict、JSON 或 CSV,但我还不是经验丰富的 python 程序员。
我试过这个:
但我认为这个解决方案行不通。关于如何将 for 循环的输出保存为 JSON 的任何提示?
python - Amazon Texttract 中的自动模板选择
我正在尝试使用 Amazon Textract for OCR 开发采购订单自动化工具。
我有 1000 多个采购订单模板。我不希望用户从列表中搜索他们的模板。
当用户上传采购订单时,如何启用自动模板选择?或者有没有提供这个功能的工具?
amazon-web-services - AWS:使用 Cloudsearch 提取文本
我正在创建一个使用某些 AWS 服务(用于培训目的)的项目。
现在大家都知道 AWS 有很多不同的服务,它需要一些关于如何使用它们以及可以将它们用于什么的知识。这就是为什么我在这里发布问题:
我的想法
我想创建一个应用程序,用户可以在其中上传他们的 PDF/图像,然后对其进行处理AWS Textract
,然后能够以智能的方式搜索他们的文档。
现在这里的诀窍是:
- 所有文档的结构都不同
- 应用程序的每个用户都有自己的文档(应该是私有的)
因此,在阅读了很多文档后,我想出了使用AWS Textract
和AWS CloudSearch
客户将他们的文件上传到我的服务。然后保存和处理该文档,AWS Textract
并将输出存储在数据库中。
搜索
现在,这是我怀疑的地方。我希望用户能够搜索他的私人文档。我一直在研究,cloudsearch
但是当文档如此不同和独特时,我不能 100% 确定它的功能。
所以我想我的问题是搜索这些独特文档的最佳方法是什么?
c# - 带有手写复选框的 AWS 文本
我有 1000 份调查表需要扫描,然后上传到我的 C# 系统,以便提取数据并将其输入数据库。调查混合了手写的 1) 文本框和 2) 复选框。我目前正在使用 Azure Read Api 来提取应该可以正常工作的手写文本,例如下面的问题 #4 返回“Python”和“编码”。
所以我的问题;任何 AWS Textract 都可以让我提取标记复选框的数据吗?例如,请参阅下面的问题 #1 - 我需要一个字符串回复说“不同意”,这可以使用任何 AWS Textract API 吗?
不幸的是,Azure Read API 和 Google Vision OCR 不提供此功能,因此如果 AWS Textract 无法帮助我解决此问题,我将不得不手动执行一些操作,例如检查像素颜色的变化以检测勾选的复选框。
调查类型:
c# - AWS Textract .Net SDK 的其他选项
我正在开发一个 C# MVC 解决方案,该解决方案需要支持将 1000 份扫描的 .PDF 调查表上传到系统上,然后从每个调查中提取数据;为了提取手写复选框,我需要使用 AWS Textract API。可以在此处找到有关我的项目的更多信息:带有手写复选框的 AWS 文本
我的问题是,当我下载适用于 .NET 的 AWS 开发工具包时,我注意到 .Textract 目前对于 .NET 并不完全可用
我的问题是,除了 AWS .NET SDK 之外,还有其他方法可以让我在我的 .NET 系统中实现 AWS Textracts 复选框功能吗?不幸的是,Googles Vision OCR API 或 Azures Read API 都不支持复选框提取。
amazon-web-services - 如何将 Amazon Textract 与 PDF 文件一起使用
我已经可以使用文本,但使用 JPEG 文件。我想将它与 PDF 文件一起使用。
我有下面的代码:
正如我所说,它工作正常。但我想使用它来传递 PDF 文件,就像在 Web 应用程序中一样进行测试。
我知道可以在 python 中将 PDF 转换为 JPEG,但是使用 PDF 会很好。我阅读了文档并没有找到答案。
我怎样才能做到这一点?
编辑 1:我忘了提到我不打算使用 de s3 存储桶。我想直接在脚本中传递 PDF,而不必将其上传到 s3 存储桶中。
amazon-web-services - AWS 文本无效参数异常
我有一个 .Net 核心客户端应用程序,根据 AWS 文档,使用带有 S3、SNS 和 SQS 的 amazon Textract,检测和分析多页文档中的文本(https://docs.aws.amazon.com/textract/latest/dg/async .html )
使用 AmazonTextractServiceRole 策略创建了一个 AWS 角色,并根据文档 ( https://docs.aws.amazon.com/textract/latest/dg/api-async-roles.html ) {“版本”添加了以下信任关系: “2012-10-17”,“声明”:[{“效果”:“允许”,“主体”:{“服务”:“textract.amazonaws.com”},“行动”:“sts:AssumeRole”} ] }
根据 aws 文档,订阅 SQS 到该主题并授予 Amazon SNS 主题向 Amazon SQS 队列发送消息的权限。
所有资源,包括 S3 Bucket、SNS、SQS 都在同一个 us-west2 区域
以下方法显示一般错误“InvalidParameterException”请求具有无效参数
但是,如果 NotificationChannel 部分被注释,则代码工作正常并返回正确的作业 ID。
错误消息没有给出关于参数的清晰图片。非常感谢任何帮助。
amazon-web-services - Nodejs AWS Textract 不适用于 lambda
我正在使用 NodeJS AWS SDK 文本来检测图像(图像文件点 PNG/JPG)。它在 AWS EC2 上运行。但它不适用于 AWS Lambda 函数。
我得到了回应: