gremlin - 如何编写一个 gremlin 查询来查找其他顶点之间的公共顶点并按重叠计数排序返回？

Question

我正在使用 python+gremlin 来实现我的图形查询，但还远远没有理解很多概念，并且遇到了一个我不知道该怎么做的有趣查询。

假设我们有许多带有标签的厨师顶点、带有标签Chef的配料顶点Ingredient和菜肴顶点Dish。在任何给定时间，厨师都可以使用手头的食材，用和之间的Chef边Ingredient表示has。Dish菜肴有配料，用介于和之间Ingredient的边缘表示uses。和之间还有一条边Chef，Dish表示他/她之前是否成功过，称为madeBefore。

可能很明显，但有些菜肴是厨师从未做过的，并非所有菜肴都使用所有食材，厨师很可能没有所有食材。

我想创建一个执行以下操作的查询：

获取厨师从未做过的菜肴，按厨师必须制作的成分最多的菜肴排序（如果能得到比例也很棒）。所以结果中的第一道菜是厨师从未做过的菜，也许有所有的原料要做，结果中间的某个地方是他们从未做过的菜，大约有一半的原料需要做，最后将是他们从未做过的菜肴，也几乎没有制作它所需的成分。

以下查询将查找厨师从未做过的所有菜肴：

g.V()\
    .hasLabel("Dish")\
    .filter(
        __.not_(
            __.in_("madeBefore").has("Chef", "name", "chefbot1")
        ))\
    .valueMap(True)\
    .toList()

但从这里开始，我不知道从哪里开始，以便根据厨师有多少食材开始对这些菜肴进行分类。

我的另一个想法是查询成分并使用project来获取连接厨师和菜肴的边数，然后以某种方式过滤它们，但我不知道之后该怎么做：

g.V()\
    .hasLabel("Ingredient")\
    .filter(
        __.in_("has").has("Chef", "name", "chefbot1"))\
    .project("v", "dishesUsingIngredient")\
    .by(valueMap(True))\
    .by(inE().hasLabel("uses").count())\
    .order().by("dishesUsingIngredient", Order.desc)\
    .toList()

我现在对 Gremlin 的问题是了解如何将更复杂的查询链接在一起，有没有人可以对如何解决此类问题有所了解？

score 1 · Accepted Answer

如果我理解您的描述，您可以执行以下操作：

g.V().hasLabel('Dish').
  filter(__.not(__.in('madeBefore').
      has('Chef', 'name', 'chefbot1'))).
  group().by('name').
    by(out('uses').in('has').
      has('Chef', 'name', 'chefbot1').count())
  .order(local).by(values)

示例：https ://gremlify.com/8w

gremlin - 如何编写一个 gremlin 查询来查找其他顶点之间的公共顶点并按重叠计数排序返回？

1 回答 1

Related

Reference