我正在H2OFrame
从 CSV 文件中读取:
val h2oFrame = new H2OFrame(new File(inputCsvFilePath))
如何执行等效的.filter()
操作(可用于 SparkDataFrame
或RDD
)。例如,我如何获得一个新的H2OFrame
where “label”(这是一个列名)在>1
哪里?
我尝试转换org.apache.spark.sql.DataFrame
为如下(简化示例):
val df = asDataFrame(h2oFrame)
val dff = df.filter(s"label > 1")
print(dff.toString(0,15))
但这似乎抛出OutOfMemoryError
如下:
异常:线程“Executor task launch worker-2”中的 UncaughtExceptionHandler 抛出 java.lang.OutOfMemoryError