我目前正在尝试使用Hail(用 python 和 Scala 编写的基因组分析库)运行基因组分析管道。最近,Apache Spark 3 发布,它支持 GPU 使用。
我尝试使用spark-rapids库启动带有 gpu 节点的本地 slurm 集群。我能够初始化集群。但是,当我尝试运行冰雹任务时,执行者不断被杀死。
在 Hail 论坛上查询时,我得到的回复是
那是 Spark-SQL 的 GPU 代码生成器,Hail 不使用任何 Spark-SQL 接口,仅使用 RDD 接口。
那么,Spark3 不支持 RDD 接口使用 GPU 吗?