我在 spark 2.0 和 scala 中使用 GraphFrame。
我需要从字符串类型的列中删除双引号(在许多列中)。我正在尝试使用 UDF 这样做,如下所示:
import org.apache.spark.sql.functions.udf
val removeDoubleQuotes = udf( (x:Any) =>
x match{
case s:String => s.replace("\"","")
case other => other
}
)
由于 GraphFrame 不支持 Any 类型,因此出现以下错误。
java.lang.UnsupportedOperationException:不支持 Any 类型的架构
什么是解决方法?