问题标签 [gora]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

49 问题

0 投票

1 回答

42 浏览

hadoop - Apache Nutch 在限制后刷新 gora 记录

我已经为 Nutch 2.3.1 配置了 Hadoop/Hbase 生态系统。我没有改变gora.buffer.read.limit，gora.buffer.read.limit即在这两种情况下都使用它们的默认值 10000。在生成阶段，我将 topN 设置为 100,000。在生成作业期间，我得到以下信息

工作完成后，我发现有 100,000 个 url 被标记为我想要的 fetched。但我很困惑上面的警告显示了什么？gora.buffer.read.limit 对我的爬行有什么影响？有人可以指导吗？

2018-04-17T07:43:02.743

0 投票

1 回答

88 浏览

sql-server - 当您必须构建一个从一组数据库写入/读取的应用程序时，Apache Gora 是否适合？

当您必须构建一个从一组数据库（包括 SQLServer、MongoDB、HBase 和 Cassandra）写入/读取的应用程序时，Apache Gora 是否适合？

这个想法是开发一个能够跨数据库执行 CRUD 操作的应用程序？请求 1 到 SQLServer，请求 2 到 MongoDB，请求 3 到 HBase，依此类推。该请求将包含有关应用程序应该访问哪个数据库的信息，并且存在一个有限的数据库列表。

有没有其他选择？

任何指针？

让我知道是否需要任何其他信息。

sql-server mongodb cassandra hbase gora

2018-05-14T19:58:13.800

0 投票

1 回答

59 浏览

java - Apache Hadoop 与 Gora 中的组合器功能

我有一个简单的 Hadoop、Nutch 2.x、Hbase 集群。我必须写一个能找到一些统计数据的 MR 工作。这是两步工作，即，我想我也需要组合器功能。在简单的 Hadoop 作业中，它不是一个大问题，因为给出了很多指南，例如这个。但我找不到任何将组合器与 Gora 一起使用的选项。我的统计数据将被添加到 Hbase 的页面中，这就是为什么我无法了解 Gora（我认为）。以下是我希望添加 com 的代码片段

java hadoop nutch gora nutch2

2019-01-02T09:17:57.087

0 投票

1 回答

18 浏览

gora - $bin/gora 文件没有运行它总是在 cmd 中说“它不被识别为内部或外部命令”

我是 Apache gora 的新手。刚安装它并由 maven 构建它（mvn clean install as in doc）。之后我试图编译 gora-turoial 模块（这是下载项目中包含的示例。）

但是当我尝试运行 apache-gora-0.8/bin/gora goracompiler gora-tutorial

它 sas 'gora 未被识别为内部或外部命令'。这些是 apache-gora-0.8 项目中的模块

gora

2019-03-24T11:56:45.697

0 投票

1 回答

43 浏览

java - Apache gora，在减速器中设置新表名的位置

我有一个应用程序，它基本上是 Apache Gora 的 Hbase Mapreduce 作业。我是一个非常简单的案例，我想将一个 Hbase 表数据复制到一个新表中。在哪里写新的表名。我已经查看了本指南，但找不到放置新表名的位置。以下是代码片段，

对于这种情况，简单的 MR 工作非常容易。

java hadoop mapreduce hbase gora

2019-08-27T03:36:18.337

0 投票

1 回答

28 浏览

mapreduce - Apache Gora Reducer 用于 Hbase 的多表输出

我在通过 Nutch 爬网的 Hbase 表中有小数据。我们使用 Apache Gora 作为 ORM。我找到了很多示例（mapreduce）来处理 Hbase 中单个表中的数据。但我的问题是我必须将数据复制到多个表中（在减速器中）。如果没有 Gora，则存在一些指南，例如，this question等。但是如何为我的案例做这件事。

mapreduce hbase nutch gora

2019-10-15T07:28:06.333

0 投票

0 回答

18 浏览

java - Hbase Mapreduce Job 在映射器中使用错误的表名

我在 Hbase 表中有一些爬网内容（通过 Nutch）。我已经写过处理一个表并通过 mapreduce 作业将其统计信息输出到一个新表中。以下是 MR 作业的代码片段。

在这种情况下，有两个表，一个在公共行给出，第二个是硬编码的（“txt”）。我的目的是用一些新的表名创建 reducer 数据存储，以便我可以在那里存储数据。但是发生的情况是在映射器中处理了“txt”表，并且由于该表中没有数据，因此请注意。以下是日志片段

我在设置方法中打印了表名。它显示了上面日志“map table: txt”中给出的文本。实际表格“a”

java hadoop mapreduce hbase gora

2019-10-15T12:07:06.270

0 投票

2 回答

1159 浏览

java - 数据bean、java bean和数据结构有什么区别

在学习 Apache Gora时，我开始了解术语数据 bean。它可以被认为是保存数据的数据结构还是其他东西。

此外，还有一个类似的术语“Java bean”。它和数据bean一样吗？这三个术语有什么区别？

java data-structures javabeans gora

2020-02-25T11:13:08.580

0 投票

1 回答

25 浏览

java - 使用 Gora 到 MongoDB 将字符串映射持久化到列表

我要尝试使用 Gora 将包含要列出的字符串映射到 MongoDB 的 POJO 持久化。我遇到了一个例外。

我的POJO如下

我已将 Avro 模式定义如下

我已经定义了 gora-mongodb-mapping.xml 如下

我无法理解我在这里错过了什么。请求帮助。TIA

java mongodb avro gora

2020-06-18T16:28:36.907

1 2 3 4 5 6 7 8 9 10

问题标签 [gora]

Reference