0

我正在使用“sm”包来研究我的数据集中的分布。对于那些好奇的人,我将招聘实践视为年龄的函数,并试图确定群体的年龄分布是否会因性别或教育等属性而发生变化。

SM 包对我来说是一种新体验,我试图找到一个函数来描述最有可能生成数据集的密度函数,前提是零假设为真(两个密度图都是由从同一分布中抽取的随机样本生成的)。我没有发布图像所需的声誉,但我在 Imgur 上发现了这个也是用 sm.density.compare 生成的。

在此处输入图像描述

我们在图像中看到的是两个核密度图和一个青色区域,我理解它是包含真实密度图的 95% 可能性的参考带,前提是两条线是由来自相同分布的数据生成的。

我想找出一种方法来计算一个向量,该向量通过 x 轴上每个值的参考带内最可能的点。根据规则,我当然愿意接受关于我疯了或应该使用另一个包的建议。

4

1 回答 1

0

显然,Rstudio 或 R 中存在一些错误,使我无法以最明显的方式解决问题。由于 R sm.density.compare 中的所有其他内容都会生成一个对象,但对我来说,当我尝试保存它时它失败了。

当我第一次绘制对象时问题自动消失了(执行 sm.density.compare 时的默认行为)然后做了同样的事情但也创建了一个新对象。

所以:

sm.density.compare(a, b, model="equal", xlab=Year of Birth")
DensityObject = sm.density.compare(a, b, model="equal", xlab=Year of Birth")

然后可以通过以下方式计算实际线:

DensityObject$average = rowMeans(cbind(DensityObject$upper, DensityObject$lower), na.rm=TRUE)
于 2014-08-09T10:31:15.747 回答