我有一个包含两列的数据框:公司名称和长格式标签。每家公司都有不同数量的标签,大约有 80k 行:
Company Tags
Company A Tag A
Company A Tag B
Company A Tag C
Company B Tag A
Company B Tag B
Company B Tag C
Company B Tag D
Company B Tag E
Company B Tag F
Company C Tag A
Company C Tag B
Company C Tag C
Company C Tag D
我想把它变成一个宽格式:
Company Tag 1 Tag 2 Tag 3 Tag 4 Tag 5 Tag 6
Company A Tag A Tag B Tag C
Company B Tag A Tag B Tag C Tag D Tag E Tag F
Company C Tag A Tag B Tag C Tag D
Spread 不起作用,因为它希望我将一列传递给它,该列将成为宽格式的列名,但我没有。所以我不能按原样传播它。看来我有两个选择:
使用附加到每个公司的数字创建另一个列,以用作宽格式的列名。但我不知道如何在每家公司的代码中做到这一点。
找到一个包,它的功能可以比 Spread 更灵活地转换数据帧。Splitstackshape 在将数据帧转换为长格式方面做得很好,但反之则不行。
任何意见,将不胜感激!另外,我很想学习如何更好地格式化这些表格,而不必做一堆手动制表符/间距。