我在存储在 S3 上的文件中有一组 JSON 消息(每行一条消息)。每条消息都有一个唯一的密钥作为消息的一部分。我还有一个简单的 DynamoDB 表,其中该键用作主键。该表包含相应 JSON 消息所在的 S3 文件的名称。
我的目标是从给定密钥的文件中提取 JSON 消息。当然,最坏的情况是消息是文件中的最后一行。
boto
使用库从文件中提取消息的最快方法是什么?特别是,是否有可能以某种方式直接逐行读取文件?当然,我可以将整个内容读取到本地文件,boto.s3.key.get_file()
然后打开文件并逐行读取并检查 id 是否匹配。但是有没有更有效的方法?
非常感谢!