问题标签 [task-tracking]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - 如何从映射器或减速器中获取 Hadoop 任务跟踪器信息
您的 Mapper 和 Reducer 类始终在特定的任务跟踪器上运行。但是我如何获得关于任务跟踪器的信息?唯一传入该setup
方法的是TaskInputOutputContext。您可以获得任务尝试 ID,但如何将其映射到 TaskTracker 对象?(例如,获取主机名、相应的作业跟踪器等。是的,我知道您可以通过主机名获取主机名,java.net.InetAddress.getLocalHost().getHostName()
但这完全在 Hadoop 之外。)
hadoop - 从站无法连接到主站并在hadoop中启动tasktracker或datanode
我正在使用一个 2 节点完全分布式的 hadoop 集群。我正在尝试连接 tasktracker 以在从节点上运行,但它无法连接到我的 9000/9001 端口。以下是配置文件,如果有人发现了什么,请大声喊叫!
来自 Tasktracker 的错误消息(在 master 上使用 start-all 运行)
MASTER主机文件
MASTER core-site.xml
MASTER mapred-site.xml
MASTER 主文件
主从文件
从主机文件
SLAVE core-site.xml
SLAVE mapred-site.xml
SLAVE 主文件
performance - Hadoop CDH5 使用 1 个 MapReduce TaskTracker 在 10 个节点上的最大网络性能
我正在尝试使用具有 10 个节点和 1 个 MapReduce TaskTracker 的 CDH5 Cloudera 获得最大的网络性能,但似乎无法获得流量来产生我需要的流量。我有 40G 网卡,目前最多只能获得 10G,真的很低。
使用 1 个 MapReduce TaskTracker 时,如何产生更好的性能和网络吞吐量?
运行——10 个节点 RedHat 6.6 当前网卡驱动 CDH5 内核:3.18.1
我已经停用了 9 个 MapReduce TaskTracker 节点,但仍然没有得到好的结果。
google-sheets - 谷歌表格函数确定参考文档的最后更改时间
背景:我有一个 Google 表格文档,其中包含我的日常任务。我的许多任务涉及我检查过去一天是否对其他 Google 表格(在我的日常任务文档中引用)进行了更改。
目标:我想要一个函数,它会告诉我其中一个引用的 Google 表格最后一次更改的时间。
我希望该函数位于 B 列中。