我正在尝试访问 S3 上的行分隔 JSON 数据。根据我对文档的理解,我应该能够做类似的事情
print data(S3(Chunks(JSONLines))('s3://KEY:SECRET@bucket/dir/part-*.json').peek()
抛出
BotoClientError: BotoClientError: Bucket names cannot contain upper-case characters when using either the sub-domain or virtual hosting calling format.
我已经尝试过导致不同错误的变化。
我可以获得以下内容来处理本地文件:
print data(chunks(JSONLines)(map(JSONLines, glob("/home/me/data/*")))).peek()
不过,我不确定为什么(map(JSONLines, glob(
需要它。
我不太了解如何使用类型修饰符