“mappers”的相关标签问题_Stack Overflow中文网

0 投票

4 回答

303 浏览

mapreduce - 映射器、减速器、过滤器

我知道 map/reduce 算法及其用途。它使用称为 Mappers 和 Reducers 的函数，但我也发现人们使用过滤器这个词。

过滤器与映射器相同还是有一些显着差异？

2009-05-02T22:44:51.557

0 投票

1 回答

319 浏览

php - 类表映射器设计 php 和 ZF

有没有更好的方法来使用映射器、现实生活对象和 table_objects 来使用 ZF。

这就是我使用 Zend 框架的方式：

用户类 -> 用户对象：

映射器：

控制器中的用法：列表操作：

或添加/保存操作：

php oop zend-framework models mappers

2009-12-11T20:02:33.183

0 投票

1 回答

520 浏览

xml - 如何从学说 2 中的现有数据库自动生成 xml 或 yaml 映射器...但不使用 cli

我是 ORM 世界的新手，并将学说 2 与 zf 项目集成。我已经阅读了学说文档和各种文章并将其集成:)。

我有一个现有的数据库，我可以从中生成我的映射器和实体。我愿意使用 XML/YAML 映射器而不是默认注释。

我在各处看到的都是 CLI 命令来生成映射器和实体，方法是在存在“教义.php（在教义官方文档中提供）”文件的 bin 目录中执行以下命令。

要生成映射器：

生成实体/模型类：

但我不想执行命令并生成映射器/实体。我正在寻找一个为我执行此操作的 PHP 脚本（通过在控制器中调用操作方法，例如：www.doctrineproj.com/admin/mdoels/autogenerate/）。

我们是否有任何 API 类或通过 php 代码执行此操作的任何方式，而不是执行 CLI 脚本。可能是通过调用

生成映射器：教义核心::generateMappers(dbParams,mapperDriver)

生成实体：教义核心::generateEntities(metaData)

或者

有没有办法使用系统调用从 php 脚本文件中执行所有 CLI 命令？

我尝试使用上述 cli 命令来使用 exec() 和 system() 。但是效果不好:(。

这是我用来从我的操作方法生成映射器的代码

公共函数自动生成操作（）{

}

但是上面的代码没有在目标目录中创建映射器。

请建议我使用自动 php 脚本从数据库中自动生成映射器和实体的最佳解决方案。

期待最佳解决方案。

谢谢拉吉

xml zend-framework doctrine-orm auto-generate mappers

2012-03-19T19:33:03.910

0 投票

1 回答

581 浏览

hive - 在 Hive 上将最大映射器数设置为 1

我需要做一些从字符串到整数 id 的映射，我正在考虑做一个 UDF 函数并将这个字符串传递给它。为此，我需要一个映射器。

如何将映射器阻止为 1？

谢谢您的帮助

hive mappers

2012-08-29T08:05:36.707

0 投票

1 回答

19860 浏览

refactoring - 在多个 mapper.xml 中重用 MyBatis ResultMap

我想重新使用来自不同 *Mapper.xml 文件的特定文件，这些文件都以某种方式读取相同的对象。

我有一个名为 Project 的数据库表，我为它创建了以下 resultMap：

它在 ProjectMapper.xml 中效果很好，但是，现在我想创建一个 ClientWithProjectsMapper.xml，我想在其中 SELECT * FROM CLIENT, PROJECT where PROJECT.CLIENT_ID = CLIENT.ID 并让 Client 对象返回一个 List 对象。换句话说，我想用一条 SQL 获得一个 ClientWithProjects。

在我的映射中，我想重用我在 ProjectMapper.xml 中定义的 ProjectMap（无需复制/粘贴），但我不知道如何实现这一点。

我可以将 ProjectMap 分解为一个单独的文件，但我没有在 MyBatis 中找到任何工具来#include 其他文件。

关于如何做到这一点的任何想法？（我正在使用 Maven，是否有任何插件可以过滤查找#include 等的文件，并将文件的内容直接包含到正在处理的文件中？）。

谢谢。

-AP_

refactoring mybatis resultset mappers

2012-11-21T19:56:03.293

0 投票

1 回答

533 浏览

hadoop - 伪分布式：需要更改映射器节点的数量

我正在使用 Intel(R) Core(TM)2 Duo 处理器。我已经在伪分布式模式下安装了 hadoop。我编写了一个需要 50 个映射器节点的程序。是否可以在伪分布式模式下拥有 50 个映射器节点，或者我将被限制为 4 个节点（2 * 核心数）。我尝试将“mapred.tasktracker.map.tasks.maximum”设置为 50，但并发性没有变化。

hadoop mapreduce mappers

2013-02-05T15:17:05.570

0 投票

1 回答

1717 浏览

java - 使用 Hadoop，如何更改给定作业的映射器数量？

所以，我有两个工作，工作 A 和工作 B。对于工作 A，我希望每个节点最多有 6 个映射器。但是，工作 B 有点不同。对于 Job B，我只能为每个节点运行一个映射器。这样做的原因并不重要——我们只是说这个要求是不可协商的。我想告诉 Hadoop，“对于作业 A，每个节点最多安排 6 个映射器。但对于作业 B，每个节点最多安排 1 个映射器。” 这可能吗？

我能想到的唯一解决方案是：

1) 在主 hadoop 文件夹下有两个文件夹，conf.JobA 和 conf.JobB。每个文件夹都有自己的 mapred-site.xml 副本。conf.JobA/mapred-site.xml 的 mapred.tasktracker.map.tasks.maximum 的值为 6。conf.JobB/mapred-site.xml 的 mapred.tasktracker.map.tasks.maximum 的值为 1。

2）在我运行作业 A 之前：

2a) 关闭我的任务跟踪器

2b) 将 conf.JobA/mapred-site.xml 复制到 Hadoop 的 conf 文件夹中，替换已经存在的 mapred-site.xml

2c）重新启动我的任务跟踪器

2d) 等待任务跟踪器完成启动

3) 运行作业 A

然后在我需要运行 Job B 时做类似的事情。

我真的不喜欢这个解决方案；它看起来很笨拙且容易失败。有没有更好的方法来做我需要做的事情？

java hadoop mapreduce hdfs mappers

2013-03-11T22:22:39.617

0 投票

1 回答

183 浏览

hadoop - Hadoop 会始终在节点之间平均分配工作吗？

假设我有 200 个输入文件和 20 个节点，每个节点有 10 个映射器插槽。Hadoop 是否总是平均分配工作，每个节点将获得 10 个输入文件并同时启动 10 个映射器？有没有办法强制这种行为？

hadoop mapreduce hdfs job-scheduling mappers

2013-03-13T20:04:08.787

0 投票

3 回答

2249 浏览

hadoop - 设置 Amazon EMR 应用程序的 Reducer 数量

我正在尝试在 Amazon EMR 下运行 wordcount 示例。

-1- 首先，我使用以下命令创建一个集群：

./elastic-mapreduce --create --name "MyTest" --alive

这将创建一个具有单个实例的集群并返回一个 jobID，比如说 j-12NWUOKABCDEF

-2- 其次，我使用以下命令启动作业：

./elastic-mapreduce --jobflow j-12NWUOKABCDEF --jar s3n://mybucket/jar-files/wordcount.jar --main-class abc.WordCount --arg s3n://mybucket/input-data/

--arg s3n://mybucket/output-data/

--arg -Dmapred.reduce.tasks=3

我的 WordCount 类属于包 abc。

这执行没有任何问题，但我只得到一个减速器。这意味着参数“mapred.reduce.tasks=3”被忽略。

有没有办法指定我希望我的应用程序使用的减速器数量？

谢谢你，尼拉杰。

hadoop amazon-emr reducers mappers

2013-09-02T22:28:13.533

0 投票

0 回答

115 浏览

networking - MapReduce 网络带宽

我正在尝试测量从映射器 Mapper_i 传输到减速器 Reducer_j 的每个 (key_a,value_a) 对所消耗的时间。

换句话说，我想知道 (key_a,value_a) 从离开 Mapper_i 到到达 Reducer_j 所用的时间？

反正有没有从映射器到减速器的传输时间？

networking hadoop mapreduce reducers mappers

2013-10-07T15:02:11.080

问题标签 [mappers]

Reference