假设我有一个x
具有此架构的 DataFrame:
xSchema = StructType([ \
StructField("a", DoubleType(), True), \
StructField("b", DoubleType(), True), \
StructField("c", DoubleType(), True)])
然后我有DataFrame:
DataFrame[a :double, b:double, c:double]
我想要一个整数派生列。我能够创建一个布尔列:
x = x.withColumn('y', (x.a-x.b)/x.c > 1)
我的新架构是:
DataFrame[a :double, b:double, c:double, y: boolean]
但是,我希望列y
包含 0 代表 False 和 1 代表 True。
该cast
函数只能对列进行操作,而不能对 a 进行操作,DataFrame
并且该withColumn
函数只能对 a 进行操作DataFrame
。如何添加新列并同时将其转换为整数?