0

您好,我想用 Python 数据表加入一个组中的所有字符串,以避免熊猫。下面是我目前正在使用的代码,我想在数据表中复制它。

有谁知道该怎么做?非常感谢!

from datatable import dt, f, by

df = dt.Frame(group1=[1, 1, 1, 2, 2, 2], group2=[1, 1, 2, 2, 2, 3], text=['a', 'b', 'c', 'd', 'e', 'f'])

df = df.to_pandas()
df2 = df.groupby(['group1', 'group2'])['text'].apply(' '.join).reset_index() # replicate this with datatable

df:
   group1  group2 text
0       1       1    a
1       1       1    b
2       1       2    c
3       2       2    d
4       2       2    e
5       2       3    f

df2 
   group1  group2 text
0       1       1  a b
1       1       2    c
2       2       2  d e
3       2       3    f
4

0 回答 0