问题标签 [hama]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Apache Hama 是否适合构建决策树?
我目前已经在 Hadoop 中实现,这是 Google 用于构建决策树的框架(也称为 PLANET)。它从单个顶点开始,随着 map reduce 作业的添加越来越多,直到树完全构建。然而,一个主要问题是大量的 map/reduce 作业一个接一个地运行,因此一直启动新作业的成本非常高。
我已经多次看到 Apache Hama 适用于像图这样的迭代算法。有人可以使用 Hama 构建一个新图,或者您只需输入一个图并对其进行一些计算吗?将我的项目转移到哈马会很容易吗?谢谢
apache - DryadOpt(并行分支和绑定库) - 可用性
我正在尝试实现并行分支和绑定 BFS。我有兴趣使用在 Dryad LinQ 之上运行的 DryadOpt。有没有人获得 DryadOpt。我知道我们可以获得 DryadLinQ 的学术版本,它也存在于 Azure 上,但有什么方法可以获得 DryadOpt。apache hama 可以处理并行分支和绑定 BFS
graph - hadoop 和图论
有没有人在 Hadoop Giraph 或 Hama 中实现过中心性、中介中心性、接近中心性等算法?或者更确切地说,有没有人在有向加权图上并行计算指标?
我找到了乌普萨拉大学的论文
利用大数据技术进行社交网络分析
而已
ubuntu - 无法在 ubuntu 12.04 LTS 上使用 apache hama(安装)
这是我拥有的配置文件(hama-site):
我已经启动了 HDFS。我还尝试在本地安装zookeeper后添加zookeeper端口属性。
完成上述配置后,我尝试执行 /bin/start-bspd.sh 脚本,它显示以下错误:
hadoop - Hadoop Mapreduce 之类的 Apache Hama 有监控网页吗?
Hadoop mapreduce 的作业跟踪器在其端口 50030 上有一个监控网页,但是当我尝试在其服务端口(我设置为 40000)上使用我的 Hama BSPMaster 节点打开浏览器时,似乎 Hama 没有这样的监控页面。Hama 的网站似乎没有提到这种类型的监控工具。
请问哈马的BSPMaster有没有这样的监控页面?
谢谢,
java - 如何从 Hama BSPJob 获取存储在计数器中的结果?
与 Hadoop Mapreduce 类似,Hama 也有计数器,如此链接中所述。
在 hadoop mapreduce 中,使用getCounters()函数检索 Counter 的值非常简单:
但是,在hama 的BSPJob类中,并没有这样的getCounters()
功能。
所以我的问题是:hama BSPJob 完成后,如何从 Counter 中检索值?
谢谢,
java - Hama BSP 中的异常
在实际运行我的 BSP 作业之前,我的 hama 在输入数据分区阶段引发了以下异常。我能知道这个异常的可能根本原因是什么吗?任何有关如何找出根本原因的建议表示赞赏。谢谢!
java - Hama BSP 中此作业的运行时分区失败
我在开始运行 hama BSP 作业时遇到了以下问题。当 hama 在实际运行我自己的代码之前尝试加载和分区输入数据时,会发生此异常。这是一些网站中讨论的已知问题,但不幸的是没有已知原因(例如,请参见此处)。
当我只运行部分数据集时,我的 BSP 工作运行良好。但是,当我运行完整的数据集时,会出现问题:(
我能知道如何解决或避免这个问题吗?
graph - Apache hama 集群的可扩展性
我正在使用 Hama 图形 API 为 Apache Hama 编程。在集群中运行我的程序时,我的可伸缩性存在问题。问题是当我增加集群中的机器数量时,我希望执行时间更短,但我得到的是更长的执行时间。
我正在使用由 8500 个顶点组成的图形运行我的程序。当使用 2 台机器的集群时,作业需要 479 秒,当使用 3 台机器时,作业需要 503 秒,当使用 10 台机器时,作业需要 530 秒。有人可以告诉我我错过了什么吗?
hama-site.xml
这是我在文件中的配置详细信息:
文件内容groomservers
为:
在我工作的主要方法中,我有以下代码:
hadoop - 我在哪里可以获得 Apache Hama-0.6.2 或更早版本的 HAMA?
谁能给我任何指向 apache hama 0.6.2 或更早版本的链接?我只在官方网站上得到 0.6.3。但我需要早期版本