我在 atoti 有一家商店,我想在那里创建基于连续变量的存储桶。
这是商店的屏幕截图:
我正在尝试根据年龄创建存储桶。
我能想到的一种解决方案是,在原始数据框中创建一个新列,然后将其加入现有商店。
是否有一种更智能的方法可以在不返回原始数据框的情况下动态创建基于另一列的列?
我在 atoti 有一家商店,我想在那里创建基于连续变量的存储桶。
这是商店的屏幕截图:
我正在尝试根据年龄创建存储桶。
我能想到的一种解决方案是,在原始数据框中创建一个新列,然后将其加入现有商店。
是否有一种更智能的方法可以在不返回原始数据框的情况下动态创建基于另一列的列?
免责声明:我是 attoti 的数据科学家。好吧,您可以使用 read_pandas 读取一个新的数据帧并将其即时加入到现有的存储中。
像这样的东西应该工作。
# age group buckets
age_groups_store = session.read_pandas(
pd.DataFrame(
data=[("0-30Y", i) for i in range(30)]
+ [("30Y - 40Y", i) for i in range(30, 40)]
+ [("40Y - 50Y", i) for i in range(40, 50)]
+ [("50Y+", i) for i in range(50, 200)],
columns=["age group", "age"],
),
keys=["age"],
store_name="Age Groups",
)
customer_store.join(age_groups_store)