我有一个看起来像这样的数据框:
_________________id ________________text______
1 | 7821 | "some text here"
2 | 7821 | "here as well"
3 | 7821 | "and here"
4 | 567 | "etcetera"
5 | 567 | "more text"
6 | 231 | "other text"
我想按 ID 对文本进行分组,这样我就可以运行一个聚类算法:
________________id___________________text______
1 | 7821 | "some text here here as well and here"
2 | 567 | "etcetera more text"
3 | 231 | "other text"
有没有办法做到这一点?我正在从数据库表中导入,并且我有很多数据,所以我不能手动进行。