问题标签 [quantile]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 使用多个 y 值进行插值
我正在尝试使用 scipy 中的几种方法从一组 x(分位数)和 y(值)样本中插入分位数函数(逆 CDF)。由于它是一个分位数函数,因此这些值有时会重复。例如,CDF 最终在 1 处变平,因此 x=1 重复几个递增的 y 值:
似乎某些插值方法是为函数构建的,并且对重复 x 不满意。有些人甚至认为重复的 x 是导数(例如 Krogh)。
知道如何解决这个问题吗?
python - 使用 scipy 和 matplotlib 绘制分位数、中位数和展开
我是 matplotlib 的新手,我想创建一个绘图,其中包含以下信息:
- 一条连接大约 200 个可变长度向量(输入)中位数的线
- 连接这些向量的相应分位数的线。
- 连接相应价差(最大和最小点)的线。
所以基本上,它有点像一个连续的箱线图。
谢谢!
r - rcpp:比较器的方便使用
我是使用 Rcpp 的初学者,我希望在计算分位数后更快地选择向量值。
在下面的示例中,当手动输入由 qnorm 函数计算的上下限(函数 val.sel.1)时,它运行良好。然而,当这些限制来自先前的计算时,不会获得结果向量(函数 val.sel.2)。我想知道我对论点的使用有什么问题。提前感谢您的帮助。阿兰
r - R中均匀QQ图的同时零带
这个问题是关于基于 R 中的逐点分位数估计绘制同时空带的便捷方法。假设我获得了一个 p 值向量,并且我想通过使用均匀 QQ 图来查看它的分布是否接近均匀分布(......如果不是,哪些点“脱颖而出”,即落在乐队之外)。这是一个示例(其中u_obs
表示不一定来自均匀分布的 p 值 - 仅用于说明目的):
根据第 5 页讨论的非参数方法,本文的图 1(左下图):http: //stat.wharton.upenn.edu/~buja/PAPERS/paper-sim.pdf,我们可以进行 10,000 次模拟和如果需要 90% 的同时界限,请获取下 5% 和上 5% 的分位数。
我的问题是:
是否有能够有效执行此任务的 R 包/代码片段?我认为这属于“功能数据分析”领域,但我不太确定。
我们可以从均匀 QQ 图的同时零界做出什么推论?检查那些超出范围的点?如果 p 值的真实分布是均匀的(即来自空值),我期望有多少点合理地在带外?
python - 如何根据值对熊猫数据框的列中的值进行分类?
我有一个数据框,其中有一列包含实际值。
我想有一个额外的列,根据继承人的大小对这些值进行分类。例如,我想知道一个值是否属于一组最大值中的最小值组。我希望这两个组具有相同数量的元素。
例如。如果我有以下值:
我想将 1,2 和 3 映射到 1 和 4、40 和 50 到 2。有没有一种简单的方法可以在数据框中执行此操作。
在上面的例子中,我只使用了两个组。但我想保持灵活。例如,对于三个组,我想将 1 和 2 映射到 1,将 3 和 4 映射到 2,将 40 和 50 映射到 3。
python - 经验分位数比较效应大小
我正在尝试使用经验数据重新创建以下积分:
其中 F, G 是 cdfs,它们的倒数是分位数函数。
这是我的代码:
有了这个,我会期望,eqces(u,u) = 0
但u = np.random.uniform(0,1,50)
通常情况并非如此。谁能告诉我我做错了什么或提出替代方案?
Edit
这段代码似乎更适合一些分析结果:
r - 计算分位数的平均值
考虑以下向量:
我想计算这个向量的五分位数,然后平均每个五分位数的向量值。
我知道获得分位数的方法是:
但我不确定如何以有效的方式计算每个分位数内的值的平均值(即底部 20% 的平均值、下 20% 的平均值等)。
有任何想法吗?
谢谢。
r - 从 PCA 和 QQ 图中识别和去除异常值
我有一个 132 x 107 的数据集,它由 2 种患者类型组成——(患者 1 的 33 人)和(患者 2 的 99 人)。
我正在寻找异常值,所以我在数据集上运行 pca 并使用以下命令完成了第 4 个组件的 qqplots
当我使用以下方法执行第二个组件的 qqplot 时:
下图显示了 2 个明显的异常值 - 左下角的红点是患者 1。
是否有任何直接的方法可以计算出数据中这些点的索引以便将它们删除?
r - 在 R 中绘制分位数
我试图找到矩阵列的平均值、平均值±标准偏差和某些分位数(5%、50%、95%)。
矩阵的尺寸为 10*20(行表示样本数,列表示时间):
现在,从这个数据集中,我想找到上面的分位数。我尝试了以下方法:
但是这些函数只给了我一个值。我希望每次都能获得上述方法(均值、标准差、分位数) 。
然后,我们如何绘制一个图表,其中x 轴是时间t(t =1 到t =20),y 轴是基金价值,并显示所有 5 条线(平均值,平均值 ± 标准差,5% 分位数, 50% 分位数和 95% 分位数)。
非常感谢您的帮助。
非常感谢
r - 从分位数回归/summary() 中提取 R^2
我正在使用该quantreg
包在 R 中运行以下分位数回归:
并通过以下方式提取系数和汇总统计量
我得到的结果是
但是,我想知道 R^2/调整后的 R^2 -summary()
命令似乎为简单的 OLS 回归提供了它,但在分位数回归的情况下却没有。
有谁知道,如何提取它们?