问题标签 [kernel-density]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R中的密度估计
我使用以下方法估计了老信徒的密度:
我如何找到一个不忠实的点的密度?谢谢!
r - 找到密度和分布之间的区域
在下面的代码中,我尝试将模拟数据的伽马分布与使用该数据计算的 MLE 进行比较。我希望能够完成将产生两个密度之间的空间的积分并将其报告为我的错误。
这些图表可以正常工作,所以我不确定为什么错误计算不是。
提前感谢您的任何帮助!
r - 在 ggplot2 facet_grid 绘图中设置不同的带宽
假设我有一个名为“data”的数据集,它是通过以下方式生成的:
查看数据,变量 V4 被模型分成两个子集(Yes [1:400] 和 No [401:800]),并且在不改变原始带宽的情况下绘制内核密度,因为 adjust=1。
我要做的是:对于Yes模型,带宽变为原来的10倍,但对于No模型,带宽保持不变。我可以做一些像让adjust=c(10, 1)这样的事情吗?我知道如何通过 plot()+lines() 实现这一点,但我想在 ggplot() 中执行此操作以进行进一步分析。
python - Python中的多变量核密度估计
我正在尝试使用 SciPy 的gaussian_kde
函数来估计多元数据的密度。在下面的代码中,我对 3D 多元法线进行采样并拟合内核密度,但我不确定如何评估我的拟合度。
我看到了这个,但不确定如何将其扩展到 3D。
也不知道我什至如何开始评估拟合密度?我如何可视化这个?
matlab - MATLAB中的二维加权核密度估计(KDE)
我正在寻找可以估计一组 2D 加权点的内核密度的可用代码。到目前为止,我在 MATLAB 中为非加权 2D KDE 找到了这个选项:http: //www.mathworks.com/matlabcentral/fileexchange/17204-kernel-density-estimation
但是,它不包含加权特征。是否有任何其他实现的功能或库应该派上用场?我考虑过“破解”这个问题,假设我有简单的权重向量:[2 1 3 1],我可以逐个重复每个采样点,两次、一次、三次和一次。我不确定这种计算在数学上是否有效。这里的问题再次是我拥有的权重向量是十进制的,因此归一化为向量的最小数量,然后将彼此相乘意味着舍入错误,特别是如果权重处于相同的数量级。
注意:MATLAB 中的 ksdensity 函数具有加权选项,但仅适用于一维数据。
r - 正态性密度分布的检验率
我有一个正态分布和一个均匀分布。我想计算一个比率:正态分布的密度与均匀分布的密度。然后我想测试这个比率是否正常。
hm
以上分布ht
是我的实验数据显示的示例;我将实际使用的向量不是在 R 中随机生成的。
我知道我可以从 QQ 图的相关系数中很好地了解正态性:
对于hm
,它是正态分布的,这给出了一个接近 1 的值。
有没有办法确定密度向量的正态性?例如hmd
和ratio
。
(附加信息:hm
并且ht
正在对长度为的基因组中的纯合和杂合 SNP 进行建模18585056
)
r - 为分组频率数据计算 R 中的密度()
这应该是一个非常简单的问题,但我在任何地方都找不到答案(部分原因是我不确定要查询什么)。
在 R 中,很容易计算以下的密度:
你只需这样做:
问题是,如果我的数据有一个像这样的“未分组”向量,那么 R(或构建数据集的查询引擎)将无法处理它。所以我需要在初始查询中使用GROUP BY
andCOUNT(*)
来压缩我的结果(因此,使用rep()
扩展计数没有帮助)。给定这样一个“计数”数据框,我如何计算如下框的密度(对于 KDE 图):
为了清楚起见,我确实需要密度图,而不是直方图。
r - 在分组变量上平均 geom_density(y=..count..)
我使用以下方法绘制一些分布:
考虑到我在 my.factor 的每个级别内没有相同数量的复制 -> 我不能只删除'group' 参数,因为 ..count.. 取决于复制的数量。因此,我想要类似 ..count../number of replicates 之类的东西
这是上下文和可重现的示例
我在 2 个栖息地(a 和 b)进行了采样:鱼的数量和每个个体的体型。我在栖息地之间进行了不同的采样工作。(ra 和 rb 分别是在栖息地 a 和 b 内采样的重复数量)我对栖息地之间在鱼类丰度和体型方面的平均差异感兴趣。但是,我不知道如何处理我没有相同数量的副本这一事实。
数据
地块
密度
数数
但是,如果没有以相同的努力对栖息地进行采样,即不同数量的重复,这是有偏见的
计数,考虑不同的重复
从最后一个图中,如何获得重复的平均线?谢谢
r - R中的核密度带宽
我有两个向量:1)~1000 个样本均值和 2)这些均值对应的~1000 个标准差。我想创建这些数据的核密度图,使用样本均值作为估计密度的观测值,并将每个均值的标准差作为每个观测值的带宽。问题是,密度只允许将长度为 1 的向量用作带宽。例如:
返回以下警告:
...我得到一个使用列表中第一项的错误作为我所有观察的带宽的图。
关于如何为用于生成内核密度图的每个观察实现单独的用户定义带宽的任何想法?
r - 加速 R 中的循环
我正在使用以下函数来估计一些数据的内核密度
我知道这不是关于加速循环的第一个问题。我在网站上进行了检查,发现有时使用某些apply
功能更快,但如果您设法正确设置循环,情况并非总是如此。
在上面的代码中,每个“不需要的东西”都被排除在循环之外,因为 - 如果我理解正确 - 建议加快计算速度。KDens
但是,我对上面的函数和density
R 默认实现的函数做了一个比较。好吧,density
需要 1 或 2 秒,而KDens
在我的机器上需要 ~30 秒。
编辑:我提供的信息不完整
假设我想加快 KDens 功能,我该怎么做?