我正在使用 python+gremlin 来实现我的图形查询,但还远远没有理解很多概念,并且遇到了一个我不知道该怎么做的有趣查询。
假设我们有许多带有标签的厨师顶点、带有标签Chef
的配料顶点Ingredient
和菜肴顶点Dish
。在任何给定时间,厨师都可以使用手头的食材,用 和 之间的Chef
边Ingredient
表示has
。Dish
菜肴有配料,用介于和之间Ingredient
的边缘表示uses
。和之间还有一条边Chef
,Dish
表示他/她之前是否成功过,称为madeBefore
。
可能很明显,但有些菜肴是厨师从未做过的,并非所有菜肴都使用所有食材,厨师很可能没有所有食材。
我想创建一个执行以下操作的查询:
获取厨师从未做过的菜肴,按厨师必须制作的成分最多的菜肴排序(如果能得到比例也很棒)。所以结果中的第一道菜是厨师从未做过的菜,也许有所有的原料要做,结果中间的某个地方是他们从未做过的菜,大约有一半的原料需要做,最后将是他们从未做过的菜肴,也几乎没有制作它所需的成分。
以下查询将查找厨师从未做过的所有菜肴:
g.V()\
.hasLabel("Dish")\
.filter(
__.not_(
__.in_("madeBefore").has("Chef", "name", "chefbot1")
))\
.valueMap(True)\
.toList()
但从这里开始,我不知道从哪里开始,以便根据厨师有多少食材开始对这些菜肴进行分类。
我的另一个想法是查询成分并使用project
来获取连接厨师和菜肴的边数,然后以某种方式过滤它们,但我不知道之后该怎么做:
g.V()\
.hasLabel("Ingredient")\
.filter(
__.in_("has").has("Chef", "name", "chefbot1"))\
.project("v", "dishesUsingIngredient")\
.by(valueMap(True))\
.by(inE().hasLabel("uses").count())\
.order().by("dishesUsingIngredient", Order.desc)\
.toList()
我现在对 Gremlin 的问题是了解如何将更复杂的查询链接在一起,有没有人可以对如何解决此类问题有所了解?