我有这个任务。一篇杂志文章涵盖了各种主题。我们分配一个数值来反映特定主题和文章之间的关系(链接)强度。将原始数据重新格式化为更方便的表示形式,如下所示。
INPUT DATA (tab-separated)
Theme Article Link_strength
A aaa 2
A bbb 8
B bbb 7
C aaa 3
OUTPUT DATA
Article Theme_A Theme_B Theme_C
aaa 2 0 3
bbb 8 7 0
我试过 R,但数据大小是个问题所以,我需要弄清楚 awk 命令可能会有所帮助。但是怎么做呢?