问题标签 [jjaql]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
157 浏览

bigdata - Jaql - 顶级操作员默认顺序

根据IBM 文档 - http://publib.boulder.ibm.com/infocenter/bigins/v1r1/index.jsp?topic=%2Fcom.ibm.swg.im.infosphere.biginsights.doc%2Fdoc%2Fc0057749.html Jaql 的顶级运算符的默认顺序是升序。但是当我运行它时,我看到默认顺序为降序。我正在使用 BigInsights 1.4 版。我想知道是否有人知道这是文档问题还是这种看似差异背后的其他原因-

0 投票
0 回答
530 浏览

java - 如何使用现有的 Hadoop 集群配置 Jaql 并使用 jaql 运算符过滤结果?

当我通过提供正确的路径从 hdfs 读取文件时,文件被成功读取,但是当我尝试使用 jaql 的转换运算符时,它会引发如下所示的异常,如果我尝试在 JAQL shell 上执行代码,则会引发异常的 job.jar 但即使在添加 jar 之后仍然会抛出异常。如果有人知道现有的hadoop集群没有正确配置JAQL,或者异常是由于其他原因造成的?


我的代码是:

有人知道我错过了什么吗?

0 投票
1 回答
3192 浏览

json - 在hadoop map reduce中读取json对象以处理数据

我是hadoop的初学者,任何人都可以帮助我在mapreduce工作中阅读json。

我用谷歌搜索并发现 jaql 适合阅读 json。但我没有找到任何关于如何在我们的 map reduce 工作中实现它的文档。

有没有其他支持在 map reduce 中读取 json 的框架?

对此有什么建议吗?

提前致谢

0 投票
1 回答
455 浏览

xml - 用猪拉丁语解析 XML

我对 Hadoop 和 Pig 都很陌生。我已经能够做一些简单的程序,但是当 XML 文件的一部分格式不正确时,一个对我来说很费力的程序是处理 XML。

我可以使用 XMLLoader('tag') 从一个很棒的 xml 文件中获取所有标签。然而,如果一个人错过了一个结构良好的封闭标签猪将停在那一个。例如

这只会拾取第一个有效标签。现在,我有使用 JAQL 的经验并且能够忽略错误记录,以便应用程序获取第二个标签。

我的问题是:他们是一种使用 Pig 而不是 JAQL 来处理糟糕的 XML 格式的方法吗?

0 投票
1 回答
80 浏览

java - Hadoop conf 文件丢失

我通过 Ibm BigInsights 提供的 RHEL 5 上的 Vm 映像使用 hadoop,我无法找到 conf 文件夹。我想用 Eclipse 嵌入 jaql 来开发前端。

0 投票
1 回答
73 浏览

jjaql - JAQL 将 int 转换为字符串

我是 jaql 的新手,没有找到很多文档。jaql 是否支持内置转换。或者需要编写 java udf 进行强制转换。我基本上想将int转换为字符串。

0 投票
1 回答
31 浏览

jjaql - JAQL 追加常量字符串

在 JAQL Shell 上,我有一个变量写入我的 HDFS 位置。该变量使用 write 函数并写入 HDFS 位置。

我想附加两个额外的常量字符串。我怎么做?

0 投票
1 回答
58 浏览

biginsights - 如何以编程方式从 jaql 中的头文件中读取模式?

我正在尝试在 JAQL 中实现以下目标并且被卡住了。

我有两个文件:文件 data.tsv,其中包含制表符分隔的数据,以及一个文件 header.tsv,其中正好包含一行带有制表符分隔值的文件,对应于文件 data.tsv 的“标题”。

我想要实现的是使用以下命令读取 data.tsv:

为此,我需要 schema_json,一个模式定义。我想从文件 header.tsv 创建这个 schema_json(并为每个字段分配“字符串”类型)。

读取 header.tsv 很简单,也可以将其放入类型的记录header_record = {"header1": string, "header2":string, ....}中。但是,如何将 jaql记录header_record 转换为schema: 类型的对象schema_json = schema {"header1":string,"header2":string, ....}

0 投票
1 回答
395 浏览

java - 将 Json 转换为 hadoop 的顺序文件

我有一个 json 文件(大小 2-3 GB)存储在 HDFS 中。我的苍蝇看起来像这种格式

我正在尝试编写一个 map reduce 来将此 json 文件转换为顺序文件,然后读取 json 对象。因为我需要使用 gson 更快地执行,然后在 java 对象中转换它需要时间。我搜索了一下,发现 JAQL 可以做同样的事情,但我没有得到任何 Java MR 代码来做这件事。我什至没有找到 JAQL 的 maven jars。我无法在我的服务器上明确设置它。有没有办法使用Java代码来实现它?

0 投票
0 回答
76 浏览

java - JAQL 替代解决方案

JAQL 是否有任何替代解决方案?我发现它自 2011 年以来没有更新。我想要带有连接、组和过滤器的 JSON 查询语言,它可以嵌入到 java 中。