“amazon-kcl”的相关标签问题

0 投票

1 回答

347 浏览

amazon-kcl - 当 AWS KCL 中的 processRecords 失败时如何处理？

我正在使用基于 KCL 的 nodejs 创建应用程序。在processRecords函数中，我尝试使用 http 请求将从 kinesis 获得的记录发送到 Web 服务。但是当web服务不可用时，http请求就会失败。我想停止 KCL 以从 kinesis 获取记录并向 pagerduty 发送警报。

有谁知道该怎么做？

amazon-kcl

2016-06-21T13:49:35.820

0 投票

3 回答

14209 浏览

amazon-web-services - Amazon KCL 检查点和 Trim Horizon

AWS KCL 库中的检查点和修整如何相关？

文档页面处理启动、关闭和节流说：

默认情况下，KCL 从流的尖端开始读取记录；这是最近添加的记录。在此配置中，如果数据生成应用程序在任何接收记录处理器运行之前将记录添加到流中，则记录处理器在启动后不会读取记录。

要更改记录处理器的行为以使其始终从流的开头读取数据，请在您的 Amazon Kinesis Streams 应用程序的属性文件中设置以下值：

initialPositionInStream = TRIM_HORIZON

使用Java 开发 Amazon Kinesis 客户端库使用者的文档页面说：

Streams 要求记录处理器跟踪已在分片中处理的记录。KCL 通过将检查指针 (IRecordProcessorCheckpointer) 传递给 processRecords 来为您处理此跟踪。记录处理器在此接口上调用检查点方法，以通知 KCL 它在处理分片中的记录方面的进展情况。如果工作程序失败，KCL 会使用此信息在最后一个已知的已处理记录处重新开始处理分片。

第一页似乎说 KCL 在流的顶端恢复，第二页在最后一个已知的已处理记录（使用标记为已处理RecordProcessor）checkpointer。就我而言，我肯定需要在最后一个已知的已处理记录处重新启动。我需要将 initialPositionInStream 设置为 TRIM_HORIZON 吗？

2016-07-23T16:49:33.463

0 投票

1 回答

1365 浏览

streaming - 如何测量 DynamoDB Streams 的传播延迟？

我正在使用 DynamoDB Streams + Kinesis 客户端库 (KCL)。如何测量在流中创建事件与在 KCL 端处理事件之间的延迟？

据我所知，KCL 的MillisBehindLatest指标特定于 Kinesis Streams（不是 DynamoDB 流）。 approximateCreationDateTime记录属性具有分钟级别的近似值，这对于在亚秒级延迟系统中进行监控是不可接受的。

您能否提供一些有用的指标来监控DynamoDB Streams 延迟？

streaming amazon-dynamodb amazon-kinesis amazon-dynamodb-streams amazon-kcl

2016-10-14T15:24:54.853

0 投票

1 回答

1503 浏览

amazon-kinesis - kinesis 客户端工作逻辑

我想了解何时从 worker 调用 IRecordProcessor 的 processRecords 方法。如果我之前对 processRecords 的调用尚未完成，worker 会调用下一个 processRecords 吗？工作人员会开始从 kinesis 获取新记录还是等到当前记录完成执行。

基本上我想等待很长时间，如果 processRecords 在将记录保存在外部数据库中时遇到一些异常，因为 db 已关闭或其他一些错误。所以想确认如果工人在早些时候完成处理之前不开始获取新记录，那么不会有任何问题？

amazon-kinesis amazon-kcl

2017-01-22T17:10:12.893

0 投票

1 回答

364 浏览