问题标签 [ecdf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1000 浏览

r - R插值data.table的列

我试图在 2 个时间序列之间插入超出概率,时间在这里并不重要。

其中 x[1] 是 data1 的 x 参数,data1 是该位置的值。考虑 1 英里和 2 英里。海拔是从 data1 的最小值到 data2 的最大值的序列。

我想在 1.5 英里处插入所有超出概率。我尝试过的是:

我收到错误:

.approxfun(x, y, v, method, yleft, yright, f) 中的错误:(列表)对象不能被强制输入“double”

这是从电话data1prob(elevation)。我相信调用高程向量而不是每行的单独高程值。当我这样做时我没有任何问题elevation[,prob:=elevation-as.numeric(approx(x = x, y =c(5,6), xout = 1.5)[2])],但是当我尝试时我会这样做 elevation[,prob:=data1prob(elevation)]

感谢您的任何意见。

0 投票
1 回答
300 浏览

r - 使用 R plot 命令的大数据集不显示线标记 (pch)

我能够绘制数据并且一切似乎都有效。唯一的问题是 R 似乎决定是否插入行标记。我有几个不同的数据集,对于 1500 的数据集,绘图工作正常,我可以看到标记。任何其他数据集,所有这些数据集都有 3000 多个点,该图忽略所有标记,只看到线。下面你们可以看到用于绘制数据的代码和示例绘图图。

我的问题是,我如何确保 R 会用标记绘制线条?难道我做错了什么?

感谢您的时间和帮助。

没有标记,绘制了 21100 个点

带标记,绘制 1400 个点

0 投票
1 回答
329 浏览

r - 如何矢量化 R 中的 ecdf 函数?

我有一个看起来像这样的数据框:

我想为效用和阶段的独特组合生成累积分布函数。在我的实际应用程序中,我最终会生成大约 100 个 cdfs,但是这个随机数据将有 12 个(4x3)独特的组合。但是我将使用这些 cdf 中的每一个数千次,所以我不想每次都即时计算 cdf。ecdf() 函数完全按照我的意愿工作,除了我需要对其进行矢量化。以下代码不起作用,但这是我正在尝试做的事情的要点:

所以在运行 ecdf_multiple 并将其分配给一个变量之后,我会通过传递一个值(我想要 cdf)、实用程序和舞台来以某种方式引用该变量。

有没有办法对 ecdf 函数进行矢量化(或使用/构建另一个函数),以便我可以多次输出而不需要一遍又一遍地生成分布?

--------添加以回应@Pascal 的优秀建议。--------

如何将其扩展为采用“n”维类别的更一般情况?这是我的刺,基于帕斯卡的二维案例。注意我是如何尝试分配“y”的:

在上面的“y”分配期间,我收到以下错误消息:

0 投票
1 回答
534 浏览

r - 在 R 中构建经验累积分布函数和数据插值

这是我正在使用的示例数据框

这个特定国家的全部人口已按收入分类,并分为 23 个相应的“级别”。变量是该Income级别所有成员的平均收入(这与说第 10 个百分位数的收入是 17995.50 很重要)。

但是每个级别的人口规模是不一致的(如果您查看cumpop即累积人口的差异,您会注意到这一点)。最终,我想构建一个 10 行数据框,为变量 提供插值的十分位值Income,例如,我们可以说“最贫穷的 10% 人口平均有 28,000 人”或“那些在 20% 到 30% 的人口中,平均收入为 41,000 英寸左右。因此,我想有效地将​​这 23 个级别减少为 10 个相同人口规模的级别(以 cumpop[23] 作为总人口),这需要一些插值。

我四处寻找一个可以进行这种经验累积分布函数生成/插值的库,它似乎ecdf非常有用,但我不确定如何将其应用于上述Income主题。cumpop

非常感谢这里的一些方向。

0 投票
1 回答
2258 浏览

r - 在ggplot中,将图例标签添加到手动色标会导致出现两个图例

使用下面的代码,我可以生成我想要的图形,但是当我尝试更改 scale_color_manual 部分中的图例标签时,仅显示线型变量的第二个图例

原始代码:

情节: 在此处输入图像描述 修改/添加的代码:

新剧情:

在此处输入图像描述

如何在不生成两个单独的图例(一个用于颜色,另一个用于线型)的情况下为图例设置标签?

0 投票
1 回答
883 浏览

r - 生成堆叠累积平滑频率分布图

我有数据记录了两种类型的事件:type_a 和 type_b 以及它们的发生年份。

这是生成我的数据示例的一种方法:

我想生成按年份堆叠在 type_a 事件之上的 type_b 事件的累积频率分布图,并且我希望分布显示为曲线而不是条形。

我猜这应该是一些操纵:

我将得到两条曲线并按类型堆叠,其中每种类型下的区域将填充不同的颜色。也就是说,type_a 曲线和 x 轴之间的区域将采用一种颜色,而 type_b 曲线和 type_a 曲线之间的区域将采用另一种颜色。

0 投票
1 回答
4439 浏览

r - 关闭 plot.ecdf() 中的虚线

在 R 中绘制一个ecdf对象会产生一个很好的经验分布函数。例如:

但是,默认行为会生成一个在 0 和 1 处带有水平虚线的图形。我没有看到plot.ecdf()在对plot.stepfun(). 现在,我实际上是在虚线上方画一条白线。

当然有办法关闭绘制这些虚线?

ecdf图

0 投票
1 回答
297 浏览

matlab - 在matlab中获得变量的经验分布?

我试图获得两个不同系列 p 和 q 的经验分布。

我使用了语法[f1,x]=ecdf(p)[f2,x]=ecdf(q). f1尽管这是两个完全不同的系列,但它们为和产生相同的值f2。我猜这是因为matlab生成的节点点 x 默认选择并且对于两个系列是相同的。正确的生成方式是ecdf什么?

p 和 q 定义如下:

0 投票
1 回答
1434 浏览

r - 分位数与 ecdf 结果

我正在尝试使用 ecdf,但我不确定我是否做得对。我的最终目的是找到与特定值对应的分位数。举个例子:

为什么会出现这种差异?我是在犯一些小错误,还是取决于分位数的计算方式?

谢谢,马克斯

0 投票
0 回答
168 浏览

r - ggplot2::stat_ecdf() 中的意外端点行为

我有一些增益图表的数据。(我有所有目标结果的建模分数的百分位数。)

在以前的版本中ggplot2,我能够构建一个看起来像这样的增益图表: 在此处输入图像描述

但在红色圈出的端点处没有奇怪的行为(所需的行为为蓝色)

带有以下声明:

有什么改变吗?我在 ggplot2 版本 2.1.0,R 版本 3.2.4。我发誓几个月前这很好用,但我最近升级了。