这看起来像一个愚蠢的问题,但我找不到从我的行中过滤空值的方法。这是我转储对象地理信息时的结果:
转储地理信息;
([longitude#70.95853,latitude#30.9773])
([longitude#-9.37944507,latitude#38.91780853])
(null)
(null)
(null)
([longitude#-92.64416,latitude#16.73326])
(null)
(null)
([经度#-9.15199849,纬度#38.71179122])
([经度#-9.15210796,纬度#38.71195131])
这是描述
描述地理信息;
地理信息:{geoLocation:字节数组}
我想要做的是过滤这样的空值:
geoinfo_no_nulls = 按地理位置过滤地理信息不为空;
但结果保持不变。什么都没有过滤。
我也尝试过这样的事情
geoinfo_no_nulls = 按地理位置过滤地理信息!= 'null';
我得到了一个错误
org.apache.pig.backend.executionengine.ExecException:错误 1071:无法将映射转换为字符串
我究竟做错了什么?
细节,在 ubuntu 上运行,hadoop-1.0.3 和 pig 0.9.3
pig -version Apache Pig 版本 0.9.3-SNAPSHOT (rexported) 编译于 2012 年 10 月 24 日,19:04:03
java version "1.6.0_24" OpenJDK Runtime Environment (IcedTea6 1.11.4) (6b24-1.11.4-1ubuntu0.12.04.1) OpenJDK 64-Bit Server VM (build 20.0-b12, mixed mode)