我正在使用 pyspark 和 hivecontext.sql,我想从我的数据中过滤掉所有 null 和空值。
所以我用简单的sql命令先过滤掉了空值,但是没有用。
我的代码:
hiveContext.sql("select column1 from table where column2 is not null")
但它在没有表达式“其中 column2 不为空”的情况下工作
错误:
Py4JavaError: An error occurred while calling o577.showString
我认为这是由于我的选择是错误的。
数据示例:
column 1 | column 2
null | 1
null | 2
1 | 3
2 | 4
null | 2
3 | 8
客观的:
column 1 | column 2
1 | 3
2 | 4
3 | 8
Tks