我正在处理相当大的数据集(每月大约 4 个 mio 行,具有 25 个数字属性和 4 个因子属性)。我想创建一个图表,其中包含每个月(过去 36 个月)每个产品的每个数字属性(4 个因素属性之一)的箱线图。
以产品 A 为例:
-
_ | -
_|_ | _|_
| | | | |
| | _|_ | |
| | | | |---|
| | |---| | |
|---| | | | |
|_ _| | | |_ _|
| |_ _| |
| | |
- | -
-
--------------------------------------------------------------
jan '10 feb '10 mar '10 ................... feb '13
但由于这些是我将要使用的相当大的数据集,我想要一些建议来开始如何处理。我的想法(但我不确定这是否可能)是
- a) 每个产品每月提取数据
- b)为该特定月份创建一个箱线图(假设产品 A 为 1 月 10 日)
- c) 将箱线图汇总数据存储在某处
- d) 在所有月份重复 ac,直到 2013 年 2 月
- e) 将所有存储的箱线图汇总数据合二为一
- f) 绘制组合箱线图 g) 对所有其他产品重复 af
所以我的主要问题是:是否可以将单独的 boxlot 摘要合并为一个并创建上面所描绘的组合图?
任何帮助,将不胜感激,
谢谢