0

如果“每个”从文件中读取 GBK 字符串并将 GBK 字符串写入文件,我该怎么办?如何定义它?

Fields namesFields = new Fields("zid", "vid", "title", "number");
sourcePipe = new Each(sourcePipe, new Fields("line"), new Parse(namesFields), Fields.ALL);
4

2 回答 2

0

2013年2月27日晚上11点24分,陈东写道:

如果我想读取字符串(格式:GBK)和写入字符串(格式:GBK)。我能怎么做?

http://docs.cascading.org/cascading/2.1/javadoc/cascading/scheme/hadoop/TextLine.html

使用带有 charsetName 参数的构造函数。

于 2013-03-01T07:30:06.807 回答
0

每个都用于对输入数据执行功能过滤。

如果您在像这样的列中有数据"zid", "vid", "title", "number"

您可以对其中一列执行过滤。如果列标题没有 jdk 字符串,您可以过滤数据。

这样带有 jdk 字符串的元组将被打印为输出。

为此,您必须通过实现接口和扩展类来编写用户定义的过滤器。filterbaseoperation

于 2013-03-01T07:34:47.930 回答