我的spark
dataframe
(df) 中有 24 个特征的数据,第 25 列是我的目标变量。我想dl4j
在这个上拟合我的模型,它以ordataset
的形式输入。如何将 my 转换为所需的类型?org.nd4j.linalg.api.ndarray.INDArray, org.nd4j.linalg.dataset.Dataset
org.nd4j.linalg.dataset.api.iterator.DataSetIterator
dataframe
我也尝试过使用 Pipeline 方法将 spark 数据框直接输入到模型中。但是 dl4j-spark-ml 的 sbt 依赖项不起作用。我的 build.sbt 文件是:
scalaVersion := "2.11.8"
libraryDependencies += "org.deeplearning4j" %% "dl4j-spark-ml" % "0.8.0_spark_2-SNAPSHOT"
libraryDependencies += "org.deeplearning4j" % "deeplearning4j-core" % "0.8.0"
libraryDependencies += "org.nd4j" % "nd4j" % "0.8.0"
libraryDependencies += "org.nd4j" % "nd4j-native-platform" % "0.8.0"
libraryDependencies += "org.nd4j" % "nd4j-backends" % "0.8.0"
libraryDependencies += "org.apache.spark" %% "spark-core" % "2.0.1"
libraryDependencies += "org.apache.spark" %% "spark-sql" % "2.0.1"
有人可以从这里指导我吗?提前致谢。