3

我正在尝试在一个非常大的数据集的 R 中创建一个箱线图。包含数据的文件是 2.5G,如果我尝试导入它会导致 R 崩溃。幸运的是,其他一些(python)软件可以毫无问题地生成均值和方差,这就是我真正想要绘制的(现在)。

到目前为止,我发现的每个教程都要求您输入完整的数据集,然后 R 计算统计数据本身,但我想知道如何将平均值、中值、最小值、最大值等传递给 bwplot 以进行绘图。我更喜欢 R 和 lattice 的原因是因为它与软件套件很好地集成了代码可能最终会进入。如果我使用 matlab 或其他一些软件,这将是一个问题,因为这将是我们当前用户的另一个要求。

4

1 回答 1

6

箱线图绘制均值或方差。您实际上需要完整排名的数据来绘制适当的箱线图,因为数量是中位数、四分位数和关闭数据点的实际值在 IRQ 的 1.5 倍内加上该范围之外的所有数据点(异常值)。对于大型数据集,这通常不是一个好主意(因为根据定义,您有数百万个异常值)。

也就是说,您可以以任何您想要的方式生成基本摘要并用于bxp绘制它们 - 请参阅?bxpR。只要确保您阐明了您正在绘制的数量(如果它们不是上述数量)。

于 2011-12-22T01:57:50.790 回答