1

我们正在尝试使用 Pig 查询过滤 hdfs 数据。我们将数据用双引号括起来。例如:“AAA”、“BBB”、“YYY”。我们正在尝试过滤 YYY 我们尝试了以下过滤方式,

FILTER a BY XXX == 'YYY';
FILTER a BY XXX == '.*YYY.*';
FILTER a BY XXX == '\'\YYY\"\';

期待您的帮助。

4

1 回答 1

2

看起来您正在尝试使用正则表达式。在这种情况下,您会遇到一些问题。您需要使用MATCHES而不是==,您必须匹配整个字符串,而不仅仅是一个子字符串,并且在使用元字符时,您必须像任何 Java 字符串一样转义反斜杠:\\d匹配一个数字,而不是\d.

于 2014-02-24T12:52:49.417 回答