8

我有两个直方图。

int Hist1[10] = {1,4,3,5,2,5,4,6,3,2};

int Hist1[10] = {1,4,3,15,12,15,4,6,3,2};

Hist1 的分布是多模态的;

Hist2 的分布是具有单个突出峰的单峰类型。

我的问题是

  1. 有什么方法可以以编程方式确定分发的类型?
  2. 如何量化这两个直方图是否相似/不相似?

谢谢

4

5 回答 5

1

这些只是猜测,但我会尝试将每个分布拟合为高斯分布,并使用 R 平方值之类的值来确定分布是否为单峰分布。

至于两个分布之间的相似性,我会尝试做一个自相关并使用自相关中的峰值正值作为相似性度量。这些想法很粗略,但希望它们能给你一些想法。

于 2010-05-27T16:36:24.543 回答
1

对于#2,您可以计算它们的互相关(只要可以对存储桶本身进行排序)。这将使您粗略估计什么是“相似性”。

于 2010-05-27T23:56:09.963 回答
1

拉吉,

我在您的另一个问题中发布了一个 C 函数(自动比较两个系列 - 差异测试),它将计算两组相似数据之间的差异。它实际上旨在告诉您真实数据与预测数据的匹配程度,但我怀疑您可以将其用于您的目的。

基本上,误差越小,两组越相似。

于 2011-01-13T23:58:54.430 回答
0

直方图比较(用于云建模)。

(这是一个 MS .doc 文件。)

于 2010-05-27T23:53:05.900 回答
0

有多种软件包可以将您的分布“拟合”到已知的离散分布 - Minitab、STATA、R 等。在R中拟合分布的参考在这里。我不建议从头开始编程。

关于分布比较,如果两个分布都不适合已知分布(泊松、二项式等),则需要使用此处描述的非参数方法。

于 2010-06-02T14:21:06.723 回答