我正在运行一个简单的连接查询
select count(*) from t1 join t2 on t1.sno=t2.sno
但是它给出了内存不足的异常。
两者t1
和t2
都是在rcfile
ssn 上进行聚类和排序的格式,每个都有 2000 万条记录。我有 3 个具有 4 GB 内存和 2 个 CPU 内核的数据节点。
我试过运行地图连接,但它也失败了。
其他配置选项是:
io.sort.mb- 500 MB
io.sort.factor- 10
fs.memory.size.mb- 500 MB
请指教。