问题标签 [gora]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
42 浏览

hadoop - Apache Nutch 在限制后刷新 gora 记录

我已经为 Nutch 2.3.1 配置了 Hadoop/Hbase 生态系统。我没有改变gora.buffer.read.limitgora.buffer.read.limit即在这两种情况下都使用它们的默认值 10000。在生成阶段,我将 topN 设置为 100,000。在生成作业期间,我得到以下信息

工作完成后,我发现有 100,000 个 url 被标记为我想要的 fetched。但我很困惑上面的警告显示了什么?gora.buffer.read.limit 对我的爬行有什么影响?有人可以指导吗?

0 投票
1 回答
88 浏览

sql-server - 当您必须构建一个从一组数据库写入/读取的应用程序时,Apache Gora 是否适合?

当您必须构建一个从一组数据库(包括 SQLServer、MongoDB、HBase 和 Cassandra)写入/读取的应用程序时,Apache Gora 是否适合?

这个想法是开发一个能够跨数据库执行 CRUD 操作的应用程序?请求 1 到 SQLServer,请求 2 到 MongoDB,请求 3 到 HBase,依此类推。该请求将包含有关应用程序应该访问哪个数据库的信息,并且存在一个有限的数据库列表。

有没有其他选择?

任何指针?

让我知道是否需要任何其他信息。

0 投票
1 回答
59 浏览

java - Apache Hadoop 与 Gora 中的组合器功能

我有一个简单的 Hadoop、Nutch 2.x、Hbase 集群。我必须写一个能找到一些统计数据的 MR 工作。这是两步工作,即,我想我也需要组合器功能。在简单的 Hadoop 作业中,它不是一个大问题,因为给出了很多指南,例如这个。但我找不到任何将组合器与 Gora 一起使用的选项。我的统计数据将被添加到 Hbase 的页面中,这就是为什么我无法了解 Gora(我认为)。以下是我希望添加 com 的代码片段

0 投票
1 回答
18 浏览

gora - $bin/gora 文件没有运行它总是在 cmd 中说“它不被识别为内部或外部命令”

我是 Apache gora 的新手。刚安装它并由 maven 构建它(mvn clean install as in doc)。之后我试图编译 gora-turoial 模块(这是下载项目中包含的示例。)

但是当我尝试运行 apache-gora-0.8/bin/gora goracompiler gora-tutorial

它 sas 'gora 未被识别为内部或外部命令'。 这些是 apache-gora-0.8 项目中的模块

0 投票
1 回答
43 浏览

java - Apache gora,在减速器中设置新表名的位置

我有一个应用程序,它基本上是 Apache Gora 的 Hbase Mapreduce 作业。我是一个非常简单的案例,我想将一个 Hbase 表数据复制到一个新表中。在哪里写新的表名。我已经查看了本指南,但找不到放置新表名的位置。以下是代码片段,

对于这种情况,简单的 MR 工作非常容易。

0 投票
1 回答
28 浏览

mapreduce - Apache Gora Reducer 用于 Hbase 的多表输出

我在通过 Nutch 爬网的 Hbase 表中有小数据。我们使用 Apache Gora 作为 ORM。我找到了很多示例(mapreduce)来处理 Hbase 中单个表中的数据。但我的问题是我必须将数据复制到多个表中(在减速器中)。如果没有 Gora,则存在一些指南,例如,this question等。但是如何为我的案例做这件事。

0 投票
0 回答
18 浏览

java - Hbase Mapreduce Job 在映射器中使用错误的表名

我在 Hbase 表中有一些爬网内容(通过 Nutch)。我已经写过处理一个表并通过 mapreduce 作业将其统计信息输出到一个新表中。以下是 MR 作业的代码片段。

在这种情况下,有两个表,一个在公共行给出,第二个是硬编码的(“txt”)。我的目的是用一些新的表名创建 reducer 数据存储,以便我可以在那里存储数据。但是发生的情况是在映射器中处理了“txt”表,并且由于该表中没有数据,因此请注意。以下是日志片段

我在设置方法中打印了表名。它显示了上面日志“map table: txt”中给出的文本。实际表格“a”

0 投票
2 回答
1159 浏览

java - 数据bean、java bean和数据结构有什么区别

在学习 Apache Gora时,我开始了解术语数据 bean。它可以被认为是保存数据的数据结构还是其他东西。

此外,还有一个类似的术语“Java bean”。它和数据bean一样吗?这三个术语有什么区别?

0 投票
1 回答
25 浏览

java - 使用 Gora 到 MongoDB 将字符串映射持久化到列表

我要尝试使用 Gora 将包含要列出的字符串映射到 MongoDB 的 POJO 持久化。我遇到了一个例外。

我的POJO如下

我已将 Avro 模式定义如下

我已经定义了 gora-mongodb-mapping.xml 如下

我无法理解我在这里错过了什么。请求帮助。TIA