问题标签 [weighting]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
numpy - 如何在python代码中调整累积周期和权重(有效干旱指数(EDI:BYUN,WILHITE 1999)
我正在编写代码,但问题很大,计算时间太长。
简而言之,这个EDI的定义(Byun and wilhite 1999) EDI是累积加权降水指数
pr = 降水,累积天数:重新定义累积天数后的 365 天(1 年)。
大问题是重新定义的代码..
我的代码如下 主要代码:return_redifine_EP_MEP_DS
子代码:return_EP_v2、return_MEP_v2、return_DEP_v2
附加说明
我正在使用 python iris 和 numpy 等,
EP_cube.data 或 MEP_cube.data 。“.data”是数组
数据集。CMIP5 模型降水(时间、纬度、经度)
origin_pr 为降水和形状(时间、纬度、经度):1971~2000
EP_cube是累积降水和(时间,纬度,经度):1972~2000
MEP_cube 是 EP_cube(时间、纬度、经度)的爬升平均值(每个日历日):365 天
DEP_cube 是 EP_cube 减去 clim mean EP_cube(MEP) ,(时间、纬度、经度):1972~2000
sy,ey 是气候学年
day 是每个型号的 1years 天(例如:HadGEM2-AO 是 360 天,ACCESS1-0:365 天)
和下面的子代码
java - 为什么平均值与原始权重相差不大?
我运行以下程序,典型的控制台输出如下。
加权 0 的
平均百分比为:57.935590153643616 加权 1 的平均百分比为:42.06440984635654
为什么这些打印的平均值不接近 60 和 40?
artificial-intelligence - 在组合模型的集成中,何时(如果有的话)模型具有负权重是否有意义?
我想通过加权结果来组合一些预测模型的结果。在最相关的作品中,模型的权重在 (0,1) 的范围内,但我发现负权重会导致更好的预测。所以,首先,我将下限设置为 -3,上限设置为 7 . 另外و我必须确定模型权重总和的约束,并且通过1的约束已经达到了最好的结果。像我提到的那样确定权重是否有意义?
r - 将Stata代码转换为R:调查权重
我正在尝试对 R 中的调查数据进行加权。我使用 Stata 代码作为参考。
该程序上用于加权我的数据的代码是:
我将该代码翻译成这样的 R 代码:
但是,我不确定这是否是正确的翻译,以及我是否在 R 中正确应用它。任何见解和建议将不胜感激!
r - r 加权复杂表 - 表格
我有一系列使用 R 中的“tables”包创建的表,以允许多个变量,例如
这很好用(并且允许添加更多我需要的变量),但我想使用加权数据生成相同的表。“调查”包为我提供了 svytable 选项,但这仅限于生成两个变量的交叉表,而不是将一个或多个变量与一系列其他变量交叉。在表格中,我可以生成加权平均值,但看不到加权百分比的方法。一种替代方法是创建几个加权表,我可以在其中创建一个变量列表以与另一个变量交叉然后绑定它们,但这似乎有点低效?
有谁知道使用表格命令创建这样一个表的方法,还是我最好找到另一种方法来创建更适合加权的表?
statistics - SPSS 是否调整加权样本的卡方检验?
在 SPSS 中,您可以使用 调整分层样本的汇总统计数据
Weight by ...
,然后可以进行卡方检验。我发现很多这样的人做卡方的例子,但没有人提到SPSS是否真的在卡方计算中考虑了这一点。
标准 SPSS 使用后是否会调整分层样本的卡方独立性检验 Weight by ...
?
R“调查”包使用Rao-Scott 校正。同样,SAS 有一个 Rao-Scott 卡方检验。我知道SPSS 复杂调查扩展- 虽然我很好奇它的工作原理,但在这里我特别感兴趣的是基础 SPSS 是否正确执行此操作。
非常感谢你的帮助!
python - python中基于优先级序列的序列匹配器
我正在尝试从股票名称列表中找到最匹配的单词,并且我希望将更多优先级放在前面的单词而不是后面的单词上,尽管后面的单词可能有更多的字符。
例如。
“SG HOLDINGS”与“S2 HOLDINGS”
与“SG HOLDING”与“SG Corp”相比,序列匹配器将显示这两个词具有更高的相似率,但后者实际上是我正在寻找的公司。我怎样才能让股票名称前面的单词更重?还有其他我可以使用的库吗?
谢谢
python - 查找权重数据框并应用于列
我有两个数据框:
df1:
df2:
如何将权重乘以每列中的数字以获得结果:
df3:
python - Python:使用权重对数据进行分箱
我有一个噪音很大的数据集,例如
我想对给定binsize
(或binnumber
)的数据进行分类。我基本上只是指一个Δx
. 分箱数据应由高斯函数加权,您可以将其视为在 y 轴上扩展的高斯函数,根据期望值的距离对数据进行加权µ
。另外,我希望数据给我1σ-error
.
我知道numpy.digitize
,scipy.stats.binned_statistic
但我没有应用这两者中的任何一个来获得我想要的分箱。也许后者应该是最容易用于这种情况的,因为它提供了参数statistic=<function>
,但我愿意接受建议。