12

第一次在这里使用 Map/Reduce 用户,并使用 MongoDB。我有很多页面访问数据,我想通过使用 Map/Reduce 来了解这些数据。下面基本上是我想做的,但作为一个 Map/Reduce 的初学者,我认为这超出了我的知识范围!

  1. 浏览过去 30 天内访问过的所有页面,其中 external = true。
  2. 然后对于每个页面,找到所有访问
  3. 按推荐位置对所有访问进行分组
  4. 对于每个推荐位置,计算有多少人访问了具有特定“类型”并且“标签”中也有特定单词的页面。

数据库和集合组织为

$mongo->dbname->visits

一个示例文档是:

{"url": "www.example.com", "type": "a", "refer": {"external": true, "domain": "twitter.com", "url": "http://www.twitter.com/page"}, "page": "1235", "user": "1232", "time": 1234567890}

然后我想找到带有特定标签的 B 类文档。

{"url": "www.example.com", "type": "b", "page": "745", "user": "1232", "time": 1234567890, "tags": {"a", "b", "c"}}

如果有影响,我正在使用普通的 Mongo PHP 扩展。

4

2 回答 2

16

好的,我想出了一些我认为可以做你想做的事情。请注意,这可能不完全有效,因为我不是 100% 确定您的架构(考虑到您的示例显示refer在类型 a 中可用,但不是 b (我不确定这是否是一个遗漏,或者考虑到您想要查看什么通过推荐人)......无论如何,这就是我想出的:

地图功能:

function() {
    var obj = {
        "types": {},
        "tags": {},
    }
    obj.types[this.type] = 1;
    if (this.tags) {
        for (var tag in this.tags) {
            obj.tags[this.tags[tag]] = 1;
        }
    }
    emit(this.refer.url, obj);
}

减少功能:

function(key, values) {
    var obj = {
        "types": {},
        "tags": {},
    }
    for (var i = 0; i < values.length; i++) {
        for (var type in values[i].types) {
            if (!type in obj.types) {
                obj.types[type] = 0;
            }
            obj.types[type] += values[i].types[type];
        }
        for (var tag in values[i].tags) {
            if (!tag in obj.tags) {
                obj.tags[tag] = 0;
            }
            obj.tags[tag] += values[i].tags[tag];
        }
    }
    return obj;
}

所以基本上,它的工作原理是这样的。Map 函数使用 refer.url 的键(我根据您的描述猜测)。所以最终结果看起来像一个_id等于 refer.url 的数组(它基于 url 分组)。然后它创建一个对象,它下面有两个对象(类型和标签)。对象的原因是 map 和 reduce 可以发出相同的格式对象。除此之外,我认为它应该是相对不言自明的(如果你不明白,我可以尝试解释更多)......

因此,让我们在 PHP 中实现它(假设$map$reduce是包含上述内容的字符串,以便简洁起见):

$mapFunc = new MongoCode($map);
$reduceFunc = new MongoCode($reduce);
$query = array(
    'time' => array('$gte' => time() - (60*60*60*24*30)),
    'refer.external' => true
);
$collection = 'visits';
$command = array(
    'mapreduce' => $collection,
    'map' => $mapFunc,
    'reduce' => $reduceFunc,
    'query' => $query,
);

$statsInfo = $db->command($command);

$statsCollection = $db->selectCollection($sales['result']);

$stats = $statsCollection->find();

foreach ($stats as $stat) {
    echo $stats['_id'] .' Visited ';
    foreach ($stats['value']['types'] as $type => $times) {
        echo "Type $type $times Times, ";
    }
    foreach ($stats['value']['tags'] as $tag => $times) {
        echo "Tag $tag $times Times, ";
    }
    echo "\n";
}

注意,我没有测试过这个。这正是我根据对您的架构的理解以及对 Mongo 及其 Map-Reduce 实现的理解得出的结论......

于 2010-06-16T13:01:30.297 回答
0

Map reduce 已经在 Mongo DB ODM 中实现:

http://www.doctrine-project.org/docs/mongodb_odm/1.0/en/reference/map-reduce.html

于 2011-03-15T17:32:19.973 回答