所以我有大量数据,我在下面采样了这些数据:
Sequence Abundance Length
CAGTG 3 25
CGCTG 82 23
GGGAC 4 25
CTATC 16 23
CTTGA 14 25
CAAGG 9 24
GTAAT 5 24
ACGAA 32 22
TCGGA 10 22
TAGGC 30 21
TGCCG 25 21
TCCGG 2 21
CGCCT 22 24
TTGGC 4 22
ATTCC 4 23
我在这里只显示每个序列的前 4 个单词,但实际上它们是“长度”长的。我正在查看我在这里拥有的每个大小类别的序列丰度。此外,我想可视化特定序列在其大小类别中所代表的丰度比例。目前,我可以制作这样的堆叠条形图:
ggplot(tab, aes(x=Length, y=Abundance, fill=Sequence))
+ geom_bar(stat='identity')
+ opts(legend.position="none")
这对于像这样的小型数据集来说很好,但我的实际数据集中大约有 170 万行。它看起来非常丰富多彩,我可以看到特定序列在一个大小类别中占多数,但它非常混乱。
我希望能够通过该序列的丰度为每个尺寸订购彩色堆叠条。即在它们的堆栈中具有最高丰度的条位于每个堆栈的底部,而具有最低丰度的条位于顶部。这样看起来应该更漂亮。
关于如何在 ggplot2 中执行此操作的任何想法?我知道 aes() 中有一个“订单”参数,但我无法弄清楚它应该如何处理我拥有的格式的数据。