如何使用手动逻辑进行特征聚合,例如在大型数据帧上使用Json Logic(也对其他解决方案开放):
例如,如果我有这个数据框(实际上它是一个大 DF):
pie_df
temp pie_filling
0 100 "apple"
1 400 "apple"
2 70 "cherry"
和这个逻辑(例如在 json 文件中),实际上逻辑文件将在不同的嵌套级别有多个聚合:
rules = { "and" : [
{"<" : [ { "var" : "temp" }, 110 ]},
{"==" : [ { "var" : "pie_filling" }, "apple" ] }
] }
我希望答案是:
pie_ready
0 true
1 false
2 false
逻辑文件应该是通用且可读的。我可以将数据帧转换为 json,但我担心这不会在计算上有效。
我确实找到了这个包:https ://github.com/nadirizr/json-logic-py但他们没有提到在数据帧上实现逻辑
此行不起作用:
jsonLogic(rules, pie_df.to_json())
我收到此错误:
{TypeError}'dict_keys' object is not subscriptable