我有以下数据框:
|-----id-------|----value------|-----desc------|
| 1 | v1 | d1 |
| 1 | v2 | d2 |
| 2 | v21 | d21 |
| 2 | v22 | d22 |
|--------------|---------------|---------------|
我想把它变成:
|-----id-------|----value------|-----desc------|
| 1 | v1;v2 | d1;d2 |
| 2 | v21;v22 | d21;d22 |
|--------------|---------------|---------------|
- 是否可以通过数据框操作?
- 在这种情况下,rdd 转换会是什么样子?
我认为 rdd.reduce 是关键,但我不知道如何使其适应这种情况。