根据此 AWS 文档,Amazon S3 似乎不支持清单文件中的 parquet 格式,但我觉得这很难相信,因为这是一种非常常见的文件格式,对于 Athena/Redshift,您应该使用我的 parquet 格式理解。这是另一篇文档,它引用了与 Redshift 和 parquet 文件格式相关的 S3 清单文件,但我不太确定它的确切含义https://docs.aws.amazon.com/redshift/latest/dg/loading-数据文件-使用-manifest.html。
我只是想在我的一个 S3 存储桶中使用一些镶木地板文件在 Amazon QuickSight 中创建一个数据集。我尝试在清单中省略 globalUploadSettings 字段,并且能够将数据拉入,但 QuickSight 不知道它是什么类型的文件,因此它只显示带有一堆 � 字符的信息。
我目前拥有的清单:
{
"fileLocations": [
{
"URIPrefixes": [
"https://s3.amazonaws.com/myBucket/myFolderWithData/"
]
}
]
}