我正在尝试通过 NA 估算空值,并且代码仅使用 Scala 可以正常工作,但是当我在 Spark 中运行代码时它无法正常工作
/* first way:- */
def blankImputation(input: String): String = {
val pattern2 = """(^.*?,,+.*$)""".r;
if (pattern2.findFirstIn(input).contains(",,")) {
return pattern2.replaceAllIn(input, ",NA,");
}
return input;
}
var cleaned_df = inputFile.map(blankImputation)
/* second way:- */
def blankImputation(input: String): String = {
val pattern2 = """(^.*?,,+.*$)""".r;
if (input.isEmpty()) {
return "NA";
}
return input;
}
var cleaned_df = inputFile.map(blankImputation)
cleaned_df.toDF().collect()
我期望 NA 而不是 Empty 值。