我的CSV数据如下:
code, label, value
ABC, len, 10
ABC, count, 20
ABC, data, 102
ABC, data, 212
ABC, data, 443
...
XYZ, len, 11
XYZ, count, 25
XYZ, data, 782
...
每个条目的数量data
是不同的code
。(这对我的问题无关紧要;我只是指出来。)
我需要分析data
每个code
. 这将包括计算中位数、绘制图表等。这意味着我应该将data
for each分开code
并使其成为数字?
有没有比这种事情更好的方法:
x = read.csv('dataFile.csv, header=T)
...
median(as.numeric(subset(x, x$code=='ABC' & x$label=='data')$value))
boxplot(median(as.numeric(subset(x, x$code=='ABC' & x$label=='data')$value)))