使用 XML 包,我能够从网站上抓取 80 多个表,而且这个数字也会随着时间的推移而增长。它们本身的表不是很大,主要是 6x10(这个大小在表之间也随着时间的推移而变化)。可取的事实是 99% 的时间表将具有相同的列,即列名。例如:
table[1]
A B C D E F
1 b b 2 2 b
2 b b 2 2 b
table[2]
A B C D E F
1 c c 2 2 c
2 c c 2 2 c
我将如何将所有表格及其观察结果组合成单独的变量(每列=变量),同时确保每个变量中的观察结果保持与原始表格的链接(例如,通过附加变量)。
由于不同的表格指的是比赛中不同轮次的结果,因此我希望实现的最终结果是能够跟踪个人在比赛中的进步,并就此而言在任何一年的不同比赛中(我希望刮了很多桌子)。
任何人都可以传递的任何漂亮的R代码都会很棒,并且使用和/或分析大量信息的最佳实践的想法将是无价的。