有没有办法将这个简单的熊猫功能复制到 cuDF?
请注意,数组长度是变化的。
下面是使用 pandas 和 NumPy(cuDF 案例中的 CuPy)的预期输出示例:
import pandas as pd
import numpy as np
df = pd.DataFrame({'user':[0,1,0,2,1], 'item':[1,2,3,4,5]})
res = df.groupby('user')['item'].apply(np.array)
res
# Output:
# user
# 0 [1, 3]
# 1 [2, 5]
# 2 [4]
# Name: item, dtype: object