“ecdf”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

1000 浏览

r - R插值data.table的列

我试图在 2 个时间序列之间插入超出概率，时间在这里并不重要。

其中 x[1] 是 data1 的 x 参数，data1 是该位置的值。考虑 1 英里和 2 英里。海拔是从 data1 的最小值到 data2 的最大值的序列。

我想在 1.5 英里处插入所有超出概率。我尝试过的是：

我收到错误：

.approxfun(x, y, v, method, yleft, yright, f) 中的错误：（列表）对象不能被强制输入“double”

这是从电话data1prob(elevation)。我相信调用高程向量而不是每行的单独高程值。当我这样做时我没有任何问题elevation[,prob:=elevation-as.numeric(approx(x = x, y =c(5,6), xout = 1.5)[2])]，但是当我尝试时我会这样做 elevation[,prob:=data1prob(elevation)]。

感谢您的任何意见。

r data.table interpolation ecdf

2015-09-26T17:27:55.563

0 投票

1 回答

300 浏览

r - 使用 R plot 命令的大数据集不显示线标记 (pch)

我能够绘制数据并且一切似乎都有效。唯一的问题是 R 似乎决定是否插入行标记。我有几个不同的数据集，对于 1500 的数据集，绘图工作正常，我可以看到标记。任何其他数据集，所有这些数据集都有 3000 多个点，该图忽略所有标记，只看到线。下面你们可以看到用于绘制数据的代码和示例绘图图。

我的问题是，我如何确保 R 会用标记绘制线条？难道我做错了什么？

感谢您的时间和帮助。

没有标记，绘制了 21100 个点

带标记，绘制 1400 个点

r dataset markers pch ecdf

2015-10-07T17:06:35.753

0 投票

1 回答

329 浏览

r - 如何矢量化 R 中的 ecdf 函数？

我有一个看起来像这样的数据框：

我想为效用和阶段的独特组合生成累积分布函数。在我的实际应用程序中，我最终会生成大约 100 个 cdfs，但是这个随机数据将有 12 个（4x3）独特的组合。但是我将使用这些 cdf 中的每一个数千次，所以我不想每次都即时计算 cdf。ecdf() 函数完全按照我的意愿工作，除了我需要对其进行矢量化。以下代码不起作用，但这是我正在尝试做的事情的要点：

所以在运行 ecdf_multiple 并将其分配给一个变量之后，我会通过传递一个值（我想要 cdf）、实用程序和舞台来以某种方式引用该变量。

有没有办法对 ecdf 函数进行矢量化（或使用/构建另一个函数），以便我可以多次输出而不需要一遍又一遍地生成分布？

--------添加以回应@Pascal 的优秀建议。--------

如何将其扩展为采用“n”维类别的更一般情况？这是我的刺，基于帕斯卡的二维案例。注意我是如何尝试分配“y”的：

在上面的“y”分配期间，我收到以下错误消息：

r ecdf

2015-10-28T04:34:49.687

0 投票

1 回答

534 浏览

r - 在 R 中构建经验累积分布函数和数据插值

这是我正在使用的示例数据框

这个特定国家的全部人口已按收入分类，并分为 23 个相应的“级别”。变量是该Income级别所有成员的平均收入（这与说第 10 个百分位数的收入是 17995.50 很重要）。

但是每个级别的人口规模是不一致的（如果您查看cumpop即累积人口的差异，您会注意到这一点）。最终，我想构建一个 10 行数据框，为变量提供插值的十分位值Income，例如，我们可以说“最贫穷的 10% 人口平均有 28,000 人”或“那些在 20% 到 30% 的人口中，平均收入为 41,000 英寸左右。因此，我想有效地将这 23 个级别减少为 10 个相同人口规模的级别（以 cumpop[23] 作为总人口），这需要一些插值。

我四处寻找一个可以进行这种经验累积分布函数生成/插值的库，它似乎ecdf非常有用，但我不确定如何将其应用于上述Income主题。cumpop

非常感谢这里的一些方向。

r interpolation ecdf

Jean Francis

2015-10-31T03:40:32.917

0 投票

1 回答

2258 浏览

r - 在ggplot中，将图例标签添加到手动色标会导致出现两个图例

使用下面的代码，我可以生成我想要的图形，但是当我尝试更改 scale_color_manual 部分中的图例标签时，仅显示线型变量的第二个图例

原始代码：

情节：修改/添加的代码：

新剧情：

如何在不生成两个单独的图例（一个用于颜色，另一个用于线型）的情况下为图例设置标签？

r ggplot2 ecdf

2015-11-05T03:20:17.767

0 投票

1 回答

883 浏览

r - 生成堆叠累积平滑频率分布图

我有数据记录了两种类型的事件：type_a 和 type_b 以及它们的发生年份。

这是生成我的数据示例的一种方法：

我想生成按年份堆叠在 type_a 事件之上的 type_b 事件的累积频率分布图，并且我希望分布显示为曲线而不是条形。

我猜这应该是一些操纵：

我将得到两条曲线并按类型堆叠，其中每种类型下的区域将填充不同的颜色。也就是说，type_a 曲线和 x 轴之间的区域将采用一种颜色，而 type_b 曲线和 type_a 曲线之间的区域将采用另一种颜色。

r ggplot2 ecdf

2015-12-03T15:39:27.640

0 投票

1 回答

4439 浏览

r - 关闭 plot.ecdf() 中的虚线

在 R 中绘制一个ecdf对象会产生一个很好的经验分布函数。例如：

但是，默认行为会生成一个在 0 和 1 处带有水平虚线的图形。我没有看到plot.ecdf()在对plot.stepfun(). 现在，我实际上是在虚线上方画一条白线。

当然有办法关闭绘制这些虚线？

r plot ecdf

2016-02-02T20:32:57.303

0 投票

1 回答

297 浏览

matlab - 在matlab中获得变量的经验分布？

我试图获得两个不同系列 p 和 q 的经验分布。

我使用了语法[f1,x]=ecdf(p)和[f2,x]=ecdf(q). f1尽管这是两个完全不同的系列，但它们为和产生相同的值f2。我猜这是因为matlab生成的节点点 x 默认选择并且对于两个系列是相同的。正确的生成方式是ecdf什么？

p 和 q 定义如下：

matlab ecdf

2016-03-05T05:43:51.103

0 投票

1 回答

1434 浏览

r - 分位数与 ecdf 结果

我正在尝试使用 ecdf，但我不确定我是否做得对。我的最终目的是找到与特定值对应的分位数。举个例子：

为什么会出现这种差异？我是在犯一些小错误，还是取决于分位数的计算方式？

谢谢，马克斯

r quantile ecdf

2016-03-10T21:46:54.663

0 投票

0 回答

168 浏览

r - ggplot2::stat_ecdf() 中的意外端点行为

我有一些增益图表的数据。（我有所有目标结果的建模分数的百分位数。）

在以前的版本中ggplot2，我能够构建一个看起来像这样的增益图表：

但在红色圈出的端点处没有奇怪的行为（所需的行为为蓝色）

带有以下声明：

有什么改变吗？我在 ggplot2 版本 2.1.0，R 版本 3.2.4。我发誓几个月前这很好用，但我最近升级了。

r ggplot2 ecdf

2016-04-06T20:55:24.073

问题标签 [ecdf]

Reference