问题标签 [ecdf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R插值data.table的列
我试图在 2 个时间序列之间插入超出概率,时间在这里并不重要。
其中 x[1] 是 data1 的 x 参数,data1 是该位置的值。考虑 1 英里和 2 英里。海拔是从 data1 的最小值到 data2 的最大值的序列。
我想在 1.5 英里处插入所有超出概率。我尝试过的是:
我收到错误:
.approxfun(x, y, v, method, yleft, yright, f) 中的错误:(列表)对象不能被强制输入“double”
这是从电话data1prob(elevation)
。我相信调用高程向量而不是每行的单独高程值。当我这样做时我没有任何问题elevation[,prob:=elevation-as.numeric(approx(x = x, y =c(5,6), xout = 1.5)[2])]
,但是当我尝试时我会这样做 elevation[,prob:=data1prob(elevation)]
。
感谢您的任何意见。
r - 使用 R plot 命令的大数据集不显示线标记 (pch)
我能够绘制数据并且一切似乎都有效。唯一的问题是 R 似乎决定是否插入行标记。我有几个不同的数据集,对于 1500 的数据集,绘图工作正常,我可以看到标记。任何其他数据集,所有这些数据集都有 3000 多个点,该图忽略所有标记,只看到线。下面你们可以看到用于绘制数据的代码和示例绘图图。
我的问题是,我如何确保 R 会用标记绘制线条?难道我做错了什么?
感谢您的时间和帮助。
r - 如何矢量化 R 中的 ecdf 函数?
我有一个看起来像这样的数据框:
我想为效用和阶段的独特组合生成累积分布函数。在我的实际应用程序中,我最终会生成大约 100 个 cdfs,但是这个随机数据将有 12 个(4x3)独特的组合。但是我将使用这些 cdf 中的每一个数千次,所以我不想每次都即时计算 cdf。ecdf() 函数完全按照我的意愿工作,除了我需要对其进行矢量化。以下代码不起作用,但这是我正在尝试做的事情的要点:
所以在运行 ecdf_multiple 并将其分配给一个变量之后,我会通过传递一个值(我想要 cdf)、实用程序和舞台来以某种方式引用该变量。
有没有办法对 ecdf 函数进行矢量化(或使用/构建另一个函数),以便我可以多次输出而不需要一遍又一遍地生成分布?
--------添加以回应@Pascal 的优秀建议。--------
如何将其扩展为采用“n”维类别的更一般情况?这是我的刺,基于帕斯卡的二维案例。注意我是如何尝试分配“y”的:
在上面的“y”分配期间,我收到以下错误消息:
r - 在 R 中构建经验累积分布函数和数据插值
这是我正在使用的示例数据框
这个特定国家的全部人口已按收入分类,并分为 23 个相应的“级别”。变量是该Income
级别所有成员的平均收入(这与说第 10 个百分位数的收入是 17995.50 很重要)。
但是每个级别的人口规模是不一致的(如果您查看cumpop
即累积人口的差异,您会注意到这一点)。最终,我想构建一个 10 行数据框,为变量 提供插值的十分位值Income
,例如,我们可以说“最贫穷的 10% 人口平均有 28,000 人”或“那些在 20% 到 30% 的人口中,平均收入为 41,000 英寸左右。因此,我想有效地将这 23 个级别减少为 10 个相同人口规模的级别(以 cumpop[23] 作为总人口),这需要一些插值。
我四处寻找一个可以进行这种经验累积分布函数生成/插值的库,它似乎ecdf
非常有用,但我不确定如何将其应用于上述Income
主题。cumpop
非常感谢这里的一些方向。
r - 生成堆叠累积平滑频率分布图
我有数据记录了两种类型的事件:type_a 和 type_b 以及它们的发生年份。
这是生成我的数据示例的一种方法:
我想生成按年份堆叠在 type_a 事件之上的 type_b 事件的累积频率分布图,并且我希望分布显示为曲线而不是条形。
我猜这应该是一些操纵:
我将得到两条曲线并按类型堆叠,其中每种类型下的区域将填充不同的颜色。也就是说,type_a 曲线和 x 轴之间的区域将采用一种颜色,而 type_b 曲线和 type_a 曲线之间的区域将采用另一种颜色。
matlab - 在matlab中获得变量的经验分布?
我试图获得两个不同系列 p 和 q 的经验分布。
我使用了语法[f1,x]=ecdf(p)
和[f2,x]=ecdf(q)
. f1
尽管这是两个完全不同的系列,但它们为和产生相同的值f2
。我猜这是因为matlab
生成的节点点 x 默认选择并且对于两个系列是相同的。正确的生成方式是ecdf
什么?
p 和 q 定义如下:
r - 分位数与 ecdf 结果
我正在尝试使用 ecdf,但我不确定我是否做得对。我的最终目的是找到与特定值对应的分位数。举个例子:
为什么会出现这种差异?我是在犯一些小错误,还是取决于分位数的计算方式?
谢谢,马克斯