我面临Disk Full error
Redshift Spectrum 频繁上的问题,因此我不得不反复扩展集群。似乎缓存将被删除。
理想情况下,我希望扩大规模以保持缓存,并找到一种方法来了解查询中需要多少磁盘空间。
是否有任何文档讨论 Redshift Spectrum 的缓存,或者他们使用与 Redshift 相同的机制?
编辑:应乔恩斯科特的要求,我正在更新我的问题
SELECT p.postcode,
SUM(p.like_count),
COUNT(l.id)
FROM post AS p
INNER JOIN likes AS l
ON l.postcode = p.postcode
GROUP BY 1;
S3 上的压缩数据总量约为 1.8 TB。Athena 花了 10 分钟,扫描了 700 GB 并告诉我Query exhausted resources at this scale factor
编辑 2:我使用了 16 TB SSD 集群。