18

我们有几个产品的嵌套类别(例如,运动 -> 篮球 -> 男装体育 -> 网球 -> 女装),并且使用 Mongo 而不是 MySQL。

我们知道如何将嵌套类别存储在像 MySQL 这样的 SQL 数据库中,但是对于如何为 Mongo 做的任何建议,我们将不胜感激。我们需要优化的操作是快速找到一个类别或子类别中的所有产品,这些产品可以嵌套在根类别下的几层(例如,男篮类别中的所有产品或女子网球类别中的所有产品)。

这个 Mongo 文档提出了一种方法,但它说当我们需要子树需要操作时它不能很好地工作(因为类别可以达到多个级别)。

关于有效存储和搜索任意深度嵌套类别的最佳方法的任何建议?

4

2 回答 2

16

您要决定的第一件事就是您将使用哪种树。

要考虑的最重要的事情是您的数据和访问模式。您已经说过,您所有工作的 90% 将是查询,并且听起来(电子商务)更新只会由管理员运行,很可能很少。

因此,您需要一个模式,让您能够通过路径快速查询孩子,即:体育 -> 篮球 -> 男子、体育 -> 网球 -> 女子,并且不需要真正扩展到更新。

正如您正确指出的那样,MongoDB 确实为此提供了一个很好的文档页面:https : //docs.mongodb.com/manual/applications/data-models-tree-structures/ 其中 10gen 实际上为树声明了不同的模型和模式方法和描述了它们的主要起伏。

如果您希望轻松查询,应该引起注意的是物化路径:https ://docs.mongodb.com/manual/tutorial/model-tree-structures-with-materialized-paths/

这是一种非常有趣的构建树的方法,因为要在上面给出的示例中查询“网球”中的“女性”,您可以简单地执行一个预先固定的正则表达式(可以使用索引:http://docs.mongodb .org/manual/reference/operator/regex/)像这样:

db.products.find({category: /^Sports,Tennis,Womens[,]/})

查找树的特定路径下列出的所有产品。

不幸的是,这个模型在更新方面真的很糟糕,如果您移动一个类别或更改其名称,您必须更新所有产品,并且一个类别下可能有数千种产品。

更好的方法是将 acat_id放在产品上,然后使用架构将类别分成单独的集合:

{
    _id: ObjectId(),
    name: 'Women\'s',
    path: 'Sports,Tennis,Womens',
    normed_name: 'all_special_chars_and_spaces_and_case_senstive_letters_taken_out_like_this'
}

因此,现在您的查询仅涉及类别集合,这应该使它们更小且性能更高。例外情况是当您删除一个类别时,产品仍需要触摸。

因此,将“网球”更改为“羽毛球”的示例:

db.categories.update({path:/^Sports,Tennis[,]/}).forEach(function(doc){
    doc.path = doc.path.replace(/,Tennis/, ",Badmin");
    db.categories.save(doc);
});

不幸的是,MongoDB 目前没有提供查询中的文档反射,因此您必须将它们拉出客户端,这有点烦人,但希望它不会导致带回太多类别。

这基本上就是它的工作原理。更新有点痛苦,但我相信能够使用索引在任何路径上立即查询的能力更适合您的场景。

当然,额外的好处是这个模式与嵌套集模型兼容:http ://en.wikipedia.org/wiki/Nested_set_model我一次又一次地发现它对于电子商务网站来说非常棒,例如网球可能同时在“运动”和“休闲”下,并且您需要多个路径,具体取决于用户来自哪里。

物化路径的模式很容易通过添加另一个来支持这一点path,很简单。

希望它是有道理的,相当长的一个。

于 2013-02-23T13:12:36.407 回答
4

如果所有类别都不同,则将它们视为标签。不需要在项目中编码层次结构,因为在查询项目时不需要它们。层次结构是一种表现形式。用其路径中的所有类别标记每个项目,因此“运动 > 棒球 > 鞋子”可以保存为{..., categories: ["sport", "baseball", "shoes"], ...}. 如果您想要“运动”类别中的所有商品,请搜索{categories: "sport"},如果您只想要鞋子,请搜索{tags: "shoes"}

这不会捕获层次结构,但是如果您考虑一下,那也没关系。如果类别不同,则在查询项目时层次结构对您没有帮助。不会有其他“棒球”,所以当你搜索它时,你只会得到层次结构中“棒球”级别以下的东西。

我的建议依赖于不同的类别,我猜它们不在您当前的模型中。但是,没有理由不能区分它们。您可能已选择将页面上显示的字符串用作数据库中的类别名称。如果您改为使用“sport”或“womens_shoes”等符号名称并使用查找表来查找要在页面上显示的字符串(如果类别名称发生变化,这也将为您节省数小时的工作时间——而且它会使网站的翻译更容易,如果您需要这样做)您可以轻松地确保它们是不同的,因为它们与页面上显示的内容没有任何关系。因此,如果您在层次结构中有两个“鞋”(例如“网球 > 女式 > 鞋”和“网球 > 男式”

于 2013-02-28T07:17:20.323 回答