我使用 pyspark
并使用 MLUtils saveaslibsvm在标签点上保存 RDD
它可以工作,但将这些文件保留在 /_temporary/ 下的所有工作节点中的文件数量。
没有抛出错误,我想将文件保存在正确的文件夹中,最好将所有输出保存到一个 libsvm 文件中,该文件将位于节点或主服务器上。
那可能吗?
编辑 +++++++++++++++++++++++++++++++++++++++++++++++++++++ ++++++++++++++++++++ 无论我做什么,我都无法使用 MLUtils.loadaslibsvm() 从我用来保存它的同一路径加载 libsvm 数据. 也许写文件有问题?