对于在 Spark 中开发的数据管道,我的测试机器配置非常低。我将只使用一个 AWS t2.large 实例,它只有 2 个 CPU 和 8 GB RAM。
我需要运行 2 个 spark 流作业,并留出一些内存和 CPU 资源用于偶尔测试批处理作业。
所以我有主人和一名工人,他们在同一台机器上。
我有一些一般性问题:1)每个工人可以运行多少个执行器?我知道默认值是 1,但是更改它是否有意义?
2)一个执行器可以执行多个应用程序,还是一个执行器只专用于一个应用程序?
3) 是否有一种方法可以使这项工作,设置应用程序可以在配置文件中使用的内存,或者当我创建火花上下文时?
谢谢