我正在使用“sm”包来研究我的数据集中的分布。对于那些好奇的人,我将招聘实践视为年龄的函数,并试图确定群体的年龄分布是否会因性别或教育等属性而发生变化。
SM 包对我来说是一种新体验,我试图找到一个函数来描述最有可能生成数据集的密度函数,前提是零假设为真(两个密度图都是由从同一分布中抽取的随机样本生成的)。我没有发布图像所需的声誉,但我在 Imgur 上发现了这个也是用 sm.density.compare 生成的。
我们在图像中看到的是两个核密度图和一个青色区域,我理解它是包含真实密度图的 95% 可能性的参考带,前提是两条线是由来自相同分布的数据生成的。
我想找出一种方法来计算一个向量,该向量通过 x 轴上每个值的参考带内最可能的点。根据规则,我当然愿意接受关于我疯了或应该使用另一个包的建议。