问题标签 [accumulo]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1078 浏览

java - 需要更多用java实现的Accumulo示例

我是 Accumulo 的新手。我已经配置了 Hadoop、Zookeeper、Accumulo。我还浏览了 Apache Accumulo wiki 和 accumulo.apache.org,但它们的示例数量较少,从开发角度揭示的信息较少。任何人都可以建议我在哪里可以找到 Accumulo 的资源或 PDF 吗?

0 投票
1 回答
1489 浏览

java - accumulo - batchscanner:每个范围一个结果

所以我的一般问题是“是否有可能让 Accumulo BatchScanner 只拉回我给它的每个范围的第一个结果?”

现在有一些关于我的用例的细节,因为无论如何可能有更好的方法来解决这个问题。我有代表来自不同系统的消息的数据。可以有不同类型的消息。我的用户希望能够向系统提出问题,例如“给我在特定时间针对所有这些系统的特定类型的最新消息”。

我的表格布局看起来像这样

这个想法是用户给我一个他们关心的系统列表、消息类型和某个时间戳。我使用了掩码时间戳,以便表格首先排序最近的。这样,当我扫描时间戳时,第一个结果是该时间之前的最新结果。我正在使用 BatchScanner,因为我有多个系统要搜索每个查询。我可以让 BatchScanner 只获取每个 Range 的第一个结果吗?我无法指定特定的键,因为最近的可能与用户给出的日期时间不匹配。

目前,我正在使用 BatchScanner 并忽略每个键的第一个结果以外的所有结果。它现在可以工作,但是当我只关心每个系统/类型的第一个结果时,通过网络拉回特定系统/类型的所有数据似乎是一种浪费。

编辑

我尝试使用 FirstEntryInRowIterator

我的目标是返回的条目将是 ("row", "fam", "qual2", "val2") 但我得到 0 个结果。似乎 Iterator 在 Range 之前被应用了?我还没有深入研究这个。

0 投票
2 回答
1767 浏览

java - 当执行“accumullo /init”命令时,我在 Hadoop 中得到一个 noClassDefFoundError

我正在使用 hadoop.2.2.0,当我尝试初始化 accumulo 时,出现以下错误。Hadoop 和 Zookeeper 正在这个系统上运行。

./accumulo 类路径命令的输出

>

任何帮助表示赞赏。

0 投票
1 回答
200 浏览

accumulo - 在 Accumulo 中,key 中需要哪些字段?

我已经尝试通读文档并进行一些搜索,但对此我不太清楚。在 Accumulo 中存储数据时,是否需要提供 Column family 和 qualifier 作为 key 的一部分?如果我只想提供一个唯一的 RowID 作为我的密钥怎么办?我会在 Mutation 对象中将 null 作为我的家人和限定符传递吗?

0 投票
2 回答
756 浏览

virtualbox - 在 VirtualBox VM 之外无法访问 Accumulo 概览控制台

我在 Ubuntu 12.04 VirtualBox VM 中运行 Accumulo 1.5。我已将 accumulo-site.xml instance.zookeeper.host 文件设置为 VM 的 IP 地址,我可以连接到 accumulo 并从远程客户端计算机运行查询。在客户端机器上,我还可以使用浏览器查看 hadoop NameNode、浏览文件系统等。但是除了直接从 Accumulo VM 之外,我无法从其他任何地方连接到 Accumulo 概述页面(端口 50095)。虚拟机和客户端之间没有防火墙,除了无法访问 Accumulo 概述页面之外,其他一切似乎都运行良好。

是否需要更改配置设置以允许外部访问 Accumulo 概述控制台?

谢谢

0 投票
2 回答
714 浏览

c# - 从 C# 连接到 Accumulo

我是使用 Accumulo 的新手。我需要通过 C# 从远程 Accumulo 读取/写入数据。我发现的 C# 的唯一代码示例/文档是 - Accumulo createBatchScanner range not working as expected

我试图在 Mac 上的 Xamarin Studio 中编译代码。
我遇到的问题是这一行:

错误 CS0246:类型或命名空间名称AccumuloProxy' could not be found. Are you missingorg.apache.accumulo.proxy.thrift' using 指令?(CS0246) (AccumuloIntegratorPrototype)

在哪里可以找到要添加到与 AccumuloProxy 客户端相关的 CSharp 项目的 DLL?有没有办法我可以生成相同的?

这是一个代码片段:

0 投票
1 回答
349 浏览

c# - 在 Accumulo Proxy C# 客户端中使用正则表达式过滤器

尝试的功能: 查询和检索与特定模式匹配的行。例如搜索条件 - rowID 像“Dining*”

(Accumulo 1.5,代理 API - CSharp)。

概括:

无法取回记录(在下面的代码片段中的 client.nextK 处失败)。我收到一条错误消息 - “结果 {nextK_result(Success: ,Ouch1: ,Ouch2: ,Ouch3: AccumuloSecurityException(Msg: java.lang.RuntimeException: org.apache.accumulo.core.client.impl.AccumuloServerException: 服务器上的错误192.168.1.44:9997))}"

我在下面的代码片段之后粘贴了日志文件内容。

代码片段:

日志文件中的错误:

2013-12-07 15:28:01,126 [tabletserver.TabletServer] 信息:为范围 1<< 添加 1 个日志作为别名 4 2013-12-07 15:29:36,256 [iterators.IteratorUtil] 错误:java.lang.ClassNotFoundException :RegExFilter.class 2013-12-07 15:29:36,257 [tabletserver.TabletServer] 警告:扫描平板电脑时出现异常 7<< java.io.IOException:java.lang.ClassNotFoundException:org.apache.accumulo 中的 RegExFilter.class。 core.iterators.IteratorUtil.loadIterators(IteratorUtil.java:248) at org.apache.accumulo.core.iterators.IteratorUtil.loadIterators(IteratorUtil.java:213) at org.apache.accumulo.core.iterators.IteratorUtil.loadIterators( IteratorUtil.java:191) 在 org.apache.accumulo.server.tabletserver.Tablet$ScanDataSource.createIterator(Tablet.java:2084) 在 org.apache.accumulo.server.tabletserver.Tablet$ScanDataSource。iterator(Tablet.java:2022) at org.apache.accumulo.core.iterators.system.SourceSwitchingIterator.seek(SourceSwitchingIterator.java:163) at org.apache.accumulo.server.tabletserver.Tablet.nextBatch(Tablet.java: 1737) 在 org.apache.accumulo.server.tabletserver.Tablet.access$3200(Tablet.java:152) 在 org.apache.accumulo.server.tabletserver.Tablet$Scanner.read(Tablet.java:1879) 在 org. apache.accumulo.server.tabletserver.TabletServer$ThriftClientHandler$NextBatchTask.run(TabletServer.java:945) 在 org.apache.accumulo.trace.instrument.TraceRunnable.run(TraceRunnable.java:47) 在 java.util.concurrent。 org.apache.accumulo.trace.instrument.TraceRunnable 中的 java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908) 中的 ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886)。run(TraceRunnable.java:47) at org.apache.accumulo.core.util.LoggingRunnable.run(LoggingRunnable.java:34) at java.lang.Thread.run(Thread.java:662) 原因:java.lang .ClassNotFoundException: RegExFilter.class at org.apache.commons.vfs2.impl.VFSClassLoader.findClass(VFSClassLoader.java:175) at java.lang.ClassLoader.loadClass(ClassLoader.java:306) at java.lang.ClassLoader.loadClass (ClassLoader.java:247) 在 org.apache.accumulo.start.classloader.vfs.AccumuloVFSClassLoader.loadClass(AccumuloVFSClassLoader.java:102) 在 org.apache.accumulo.core.iterators.IteratorUtil.loadIterators(IteratorUtil.java:232 ) ... 15 更多 2013-12-07 15:29:36,260 [thrift.ProcessFunction] 错误:内部错误处理 startScan java.lang.RuntimeException: java.util.concurrent.ExecutionException: java.io.IOException: java.lang .ClassNotFoundException:RegExFilter.class

尝试: 将 RegExFilter.class 保存到 $ACCUMULO_HOME/lib/ext 这没有帮助。

0 投票
2 回答
421 浏览

python - 使用 Pyaccumulo 删除 Accumulo 中的一行

我正在尝试使用 RowDeletingIterator 删除一行。我正在运行 Accumulo 1.5.0。这就是我所拥有的

我正在打印记录以验证扫描仪是否正在扫描适当的记录。可悲的是,它们似乎没有被删除。我会很感激任何见解,因为 Pyaccumulo 的文档不是最好的。

我知道有一个错误 ( ACCUMULO-1800 ) 需要在通过 Thrift 删除时使用时间戳,但是当我指定 ts 字段时,除了现有记录之外,我只看到一条空白记录。

0 投票
1 回答
150 浏览

apache-pig - Accumulo-Pig 错误 - 每个作业只能设置一次 AccumuloInputFormat 的连接器信息

版本:
Accumulo 1.5
猪 0.10

尝试:
使用 accumulo-pig 从 Pig 读取/写入 Accumulo 中的数据。
遇到错误 - 非常感谢您对克服此错误的任何见解。
切换到 Accumulo 1.4 不是一种选择,因为我们在 C# 代码库中使用了 Accumulo Thrift 代理。

影响:
这是目前我们项目中的一个障碍。

来源参考:
源代码 - https://git-wip-us.apache.org/repos/asf/accumulo-pig.git

错误:
在尝试从 Pig 读取 Accumulo 中的数据集时,我收到以下错误 -

org.apache.pig.backend.executionengine.ExecException:错误 2118:AccumuloInputFormat 的连接器信息只能为每个作业设置一次

代码片段:

0 投票
1 回答
373 浏览

hadoop - Cloudera CDH4 上的 Accumulo - 启动组件时拒绝访问

我有一个小型集群,使用 Cloudera CDH4 Hadoop 和 Map Reduce v1 运行。Namenode/Secondary Namenode/Jobtracker 都在不同的机器上。我的三台服务器也充当 Zookeeper 服务器。

我正在尝试在此集群之上安装 Accumulo 1.4.4。我对 Accumulo 1.5.0 有同样的行为。我能够bin/accumulo init初始化 Accumulo,但启动单个组件失败。我正在尝试让我的 Namenode 成为 Accumulo 大师。

bin/start-server.sh localhost monitor吐出一个非常令人鼓舞的Starting monitor on localhost,但没有任何开始。如果我检查 logs/monitor_localhost.err 我会找到一个堆栈跟踪:

AccessControlException: access denied 对我来说似乎很重要,但我无法想象哪些访问受到限制。我以 hdfs 用户身份运行所有内容,该用户拥有整个 /opt/accumulo-1.4.4/ 目录,其中 accumulo 未解压缩。HDFS 中的 /accumulo 目录也归 hdfs 用户所有。SELinux 是允许的。网上搜了没结果,有没有人处理过这个错误?

非常感谢。