今天,当我通过 Kinesis、Firehose 和 Redshift 完成第一个学习步骤时,我很高兴地发现 Amazon 有一个“试用我们的演示数据生成器”设置。
我很沮丧地得知它似乎并没有真正起作用。
于是,我去挖了。而且我发现STL_LOAD_ERROR
包含错误,表明需要一个分隔符,并且记录的前面看起来像{field:val,field:val}{field:val,field:val}
.
...{"TICKER_SYMBOL": | 1214 | Delimiter not found
“一定是在某处剥离换行符,”我想。
经过挖掘,我发现在相关的 S3 存储桶中有生产记录,格式令人惊讶:
{field:val,field:val}{field:val,field:val}...
也就是说,明显的记录之间没有分隔符,它们是一个几十K的单行文件。
其他 SO 帖子似乎表明这实际上是预期的数据格式。
为什么 Redshift 需要数据演示不使用的格式的数据?我要重新配置哪个?