我正在做一个包含大数据的程序,这就是我使用 Spark 和 Scala 的原因。我需要对数据库进行分区,为此我使用
var data0 = conf.dataBase.repartition (8) .persist (StorageLevel.MEMORY_AND_DISK_SER)
但是然后我需要在分区中做一些事情,然后再继续使用与该分区对应的数据库,为此我使用
var tester = data0.mapPartitions {x =>
configFuzzyPredProblem ()
Strategy.getStrategy.executeStrategy (conf.iterByRun, 5, GeneratorType.HillClimbing)
} .persist (StorageLevel.MEMORY_AND_DISK_SER)
在executeStrategy()
我使用数据库的方法中,但我不知道它是全局数据库还是与该分区对应的数据库。如何知道我使用的是哪一个,然后只使用该分区的数据库执行分区处理?