问题标签 [amazon-forecast]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
amazon-web-services - Amazon Forecast 的 create_dataset_import_job S3 角色需要星号访问 S3 资源
我编写了一个 Lambda 函数来创建数据集导入作业(链接到 API)。该请求的Datasource
属性需要一个S3 Config 项,该项又包含一个IAM 角色,“Amazon Forecast 可以假定该角色访问 Amazon S3 存储桶或文件”。
在尝试遵循最少访问的原则时,我想给予该角色(下面的 Cloud Formation 定义)尽可能少的权限。我可以将其操作限制为仅列出和获取;但是,除非我授予它访问权限,否则它不起作用Resource: *
。我更愿意让它访问Resource: arn:aws:s3:::my-bucket/*
(或更好Resource: arn:aws:s3:::my-bucket/path/to/my_file.csv
。我得到的错误消息(不使用时Resource: *
)是
调用 HeadObject 操作时发生错误 (404):未找到
或者
调用 HeadObject 操作时发生错误 (403): Forbidden
取决于我是在本地运行(通过 SAM CLI)还是在 LAMBDA 控制台中运行。
¿ 有没有人遇到过一个原因,为什么 Forecast 在创建数据集导入作业时会出错而没有对所有s3 的只写访问权限,而不是只有一个存储桶,或者更好的是一个文件?
amazon-web-services - AWS Forecast 错误提示过滤器 ID 丢失或无效
每当我想进行预测查找时,都会收到以下错误消息:
我对为什么会收到此错误一无所知。我检查了我的预测键(即 item_id)和值(即 F11),它们与我用于数据集的 .csv 相符。我还检查了我为数据集设置的属性的顺序,它们也适合我的 .csv。
我的 csv 中的示例行如下所示:
我的数据模式如下所示:
那么这里的错误在哪里呢?
amazon-web-services - 亚马逊预测需要很长时间才能预测
就像标题所说的预测生成需要很长时间。我正在更新数据(目标和相关数据)并且我已经预训练了一个预测器。目标数据集相对较小,粒度为 1 小时。
在每一代预测中,预测器似乎在进行推理之前都会重新训练。我正在尝试提前 1 个月进行预测,我发现的唯一解决方案是重新上传数据并使用 24 小时预测范围进行新的预测(这用于训练预测器)。
上传/导入作业/预测生成和导出总共需要将近 1 小时。
无论如何我可以更新数据并更快地生成预测,而无需让预测重新训练新添加的数据?
python-3.x - 自动化 AWS Glue 工作流程
自动化 AWS Glue 工作流程有哪些不同的方法,我在 AWS S3 中有数据,现在我必须自动化 AWS Glue 工作流程(执行 Amazon 预测并将结果写回 AWS S3)
amazon-web-services - 亚马逊预测:[错误]:项目数 (n) 的观测值 (n) 太少,每个项目平均 1.000 个观测值
我正在尝试将时间序列数据导入亚马逊预测。导入数据集组时,我收到一条错误消息
项目数 (1055) 的观测值 (1055) 太少,平均每个项目 1.000 个观测值
我的数据集有 1055 个条目,csv 格式:[item_id,timestamp,utility]
对于这个问题,我可以想到两个可能的两个原因:
- 每个项目都需要唯一标识--> 上面的数据集具有 item_id,每个项目都是唯一的。
- 1055 条记录太少 --> 我尝试导入 100k 条记录。仍然面临同样的问题。
在这里,数据集中的每个项目都可以唯一标识。AWS 预测文档没有提到这个错误。
time-series - 胶子TS。次日预测错误及问题
再会!
我正在尝试使用 Gluon TS 预测未来 1 天。
我的数据集如下所示:
df: 日期卷 Jan1 100 ... June1 99 June2 105 June3 90 June4 NaN
如何预测未来 1 天(6 月 4 日)?
我尝试了以下示例:
_然而,我得到一个错误:'Got NaN in first epoch。尝试降低初始学习率。'__
如果我有所有以前的数据(6 月 3 日及更早),我应该如何预测 6 月 4 日?我究竟做错了什么?
另外,如果我改用目标 June3(与上面相同的数据集,数据包括 June3 和 June4 NaN 值)。
我得到的预测结果非常接近 6 月 3 日的结果。
它是简单地复制 June3 的结果,还是使用 June2 和更早的时间,然后尝试预测未来 1 天(June3)?
amazon-web-services - 由于缺少数据,AWS Forecast 无法训练预测器
这个问题很接近,但对于我使用单个数据集且没有相关时间序列的类似问题并不能完全帮助我。
我将 AWS Forecast 与单个时间序列数据集一起使用(没有相关数据,只有主 DS)。它是一个每日数据集,包含 2010-2020 年约 10 年的数据。
我在原始数据集中有 3572 个数据点;我手动填写了缺失的数据,以确保在总共 3739 个数据点的日期范围内没有缺失天数。我在 2020 年砍掉了所有东西来创建一个验证数据集,然后为 180 天的预测配置了预测器。我不断收到以下错误:
绝对没有丢失的数据,我已经两次和三次检查了日期范围和数据填充,并且开始日期和结束日期之间的每一天都有一个数据点。我还尝试添加 2020 年 1 月 1 日的数据点(它于 2019 年 12 月 31 日结束),但我继续收到此错误。我不知道它在问我什么,除了我的数学中可能遗漏了一些关于预测地平线和回测窗口偏移的东西?
简要模型参数(如果我遗漏了相关内容,可以分享更多):
amazon-web-services - AWS 从存储在 Redshift 上的大型时间序列数据进行预测
我将过去 3 年的销售数据存储在 Redshift 中,并且每天都会更新。我想每周开始预测下周(基于任何算法作为开始)。
由于我们每天有 1000 万个数据点,我想直接在 Redshift 中作为查询运行预测并从中生成预测。
理想的方法是什么?
(目前我正在使用 HWES(指数平滑),由于计算能力限制,它正在 Pandas 中的较小数据子集上运行。如果需要,可以灵活地查看任何预测模型,例如 SARIMA、Deep AR)
amazon-web-services - 列出使用 AWS Forecast Export Job 时导出到 AWS S3 存储桶的所有预测 CSV 文件
我已经在 AWS Forecast 上训练了一个 Predictor,并用它来进行一些预测。我想将这些预测作为 CSV 文件。为此,我创建了一个“ForecastExportJob”。导出完成后,我可以成功看到我的 S3 存储桶中的 CSV 文件。
我想以编程方式下载它们,那么有没有办法获得与使用“ForecastExportJob”命令创建的 CSV 文件相对应的 S3 密钥列表?
我可以列出目标存储桶中的所有对象并过滤它们,但我想知道是否有一个“更优雅”的解决方案来解决我的问题。
简单来说,我想知道有没有AWS命令可以列出“ForecastExportJob”命令创建的文件:
- 电力预测_export_job_2021-01-04T06-40-23Z_part0.csv
- ...
- 电力预测_export_job_2021-01-04T06-40-23Z_part7.csv
注意:我使用的是 boto3
提前谢谢你,新年快乐!
amazon-web-services - 手动将缺失值发送到 Amazon Forecast
我第一次尝试使用亚马逊预测。
阅读文档后,我想手动填充数据集中的缺失值。我想确保亚马逊能够很好地理解我发送的内容。
我的缺失值主要分为两类:
- 商品有库存但未售出的天数(实数 0)
- 商品缺货且未售出的天数(根据亚马逊文档为 NaN)
所以在我的数据集中,我做了这个:
亚马逊会理解NaN
我包含在数据集中的字符串吗?我无法从文档中了解 NaN 是否只是 Amazon 可以用来自动填充缺失值的一种方法,或者我是否实际上可以将这些值包含在我的数据集中。
谢谢您的帮助