这是我读入数据帧的数据结构。
treatment egf mean se
10 uM PP2 -697.25 14124.349
10 uM PP2 1 nM EGF 14715.50 8862.012
DMSO 58589.25 7204.824
DMSO 1 nM EGF 87852.00 12149.159
treatment 和 egf 列的组合表示每列的唯一 ID。我想创建一个将这些组合在一起的列,以便我可以拥有一个唯一代表每一行的列。但是,由于 EGF 列中的缺失值,当我使用粘贴时,它会做这件烦人的事情:
>paste(rawp$treatment, rawp$egf, sep=" + ")
[1] "10 uM PP2 + " "10 uM PP2 + 1 nM EGF" "DMSO + "
[4] "DMSO + 1 nM EGF"
当缺少值时,它仍会将分隔符放在那里。我希望它阅读:
[1] "10 uM PP2" "10 uM PP2 + 1 nM EGF" "DMSO"
[4] "DMSO + 1 nM EGF"
我怎样才能做到这一点?
我想这样做的全部原因是因为我想用 ggplot 绘制数据,并且在指定 x 轴时似乎只需要 1 个唯一列。
ggplot(data=rawp, aes(x=treatment, y=mean)) + geom_bar(stat="identity")
因此,如果您还知道使用组合列指定 x 轴上的类别的另一种方法,那将很有帮助。