问题标签 [weighting]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 将加权变量应用于 R 中的整个调查数据集
我有一个来自调查的大型数据集。我已经有一个列/变量,它是一个应该应用于整个数据集的权重。这可以通过 SPSS 简单地实现,但我也想在 R 中做到这一点。我已经知道如何将加权变量应用于单个列,如下所示:
这对一个变量很有用,但我不想对我运行的每一个命令都这样做。有没有办法适用于整个数据集?
我将外部数据库的一个较大子集缩减为一个简单的三变量 DF,并且我想将一个预先计算的权重变量应用于整个 DF。
总结输出:
python - 编码概率加权函数误差
我对我的代码有疑问(对不起,如果它真的很简单或很愚蠢,我以前从未编写过代码并尝试过这个项目)。我尝试为某个概率向量运行概率加权函数。然而,我得到一个错误,我不知道如何解决它。当我首先单独运行函数的参数然后在函数中调用它时它可以工作,但为什么它在函数本身中不起作用?下面的代码
我希望你能帮助我。非常感谢!
python - 包括调查加权变量
我正在使用 Python 处理调查数据。有一个基于年龄、性别和地区的加权变量应包含在计算中(以使数据代表人口)。
加权变量是一个简单的十进制数,通常介于 >= 0.9 和 <= 1.2 之间。
我不知道如何将它包含在简单的计算中。大多数变量都有“是/否/不确定”值或其他类别。
例如,如何在此处包含权重变量:
r - 如何计算加权排名分数?
给定一个排名问题的输出:
我想计算每个字母的排名分数 = 字母上每个排名的计数数 * 每个排名的权重(rank1 = 5 分,rank2 = 4 分,...,rank5 = 1 分)/总响应数.
为了按字母计算每个等级的计数,我使用了这个:
所以现在我想计算每个字母的分数(例如 A = (2 * 5 + 2 * 4) / 4)我不知道如何获得总响应数,然后如何创建一个函数计算排名分数。
python - Python中的重新加权(rake)
我正在寻找一个 python 库来替换 R 库“Survey”中的 rake 函数(https://www.rdocumentation.org/packages/survey/versions/4.0/topics/rake)
我已经找到并尝试了Quantipy,但是与在同一数据集上使用 R 生成的权重相比,权重质量很差。我找到了 PandaSurvey,但似乎无法正常工作(而且文档很差)
我很惊讶在谷歌上没有找到太多关于这个主题的内容。但是,如果您使用民意调查,它是一项必不可少的功能。Python 作为一种数据科学语言,令人惊讶。但也许我错过了。
非常感谢!
linq - Linq 运算符聚合匹配值并对其加权
工作代码。
我想要的是按时间框架匹配和按属性加权进行汇总。有没有一些Linq Kung Fu可以做到这一点?我应该有一些我通过属性名称乘以权重的类吗?我怀疑聚合运算符中有一些允许这样做的东西?
在通过修改或加权聚合值时,无法真正找到显示逻辑操作匹配的内容。
r - anesrake 错误:“没有变量的偏离超过 ____”
我需要根据来自更广泛人群的四个人口特征的边际分布对样本中的观察结果进行加权。我目前正在使用该软件包anesrake
来执行此操作。
人口信息存储在targets
. 这是一个包含 4 个元素的列表 - 我想根据每个受访者属性对样本进行加权的一个数字向量。每个元素的行名代表不同的类别。我targets
在这里创建:
调查文件 ( m1b
) 是一个数据框,其中包含人口统计信息和每个受访者的唯一 ID(此处链接到谷歌表)。这是前几个obs:
使用该anesrake
程序包,我想构建一个名为的新变量weight
,我可以在以后的分析中使用它来解释总体和样本边际分布之间的差异。
但是当我这样调用anesrake
函数时(pctlim
参数非常小以至于夸大了我的观点):
我收到以下错误:
尽管这在客观上是不正确的。例如,考虑 quota_ed 目标:
任何关于我做错了什么的想法将不胜感激。请参阅此链接到 RBloggers 帖子,了解我要模拟的例程。
r - R twang 包的 mnps 函数显示绝对标准差图的警告错误
我有一个包含 3465 个观察值和 5 个变量的数据集,如下所示(命名为:数据集)
变量
$ Treat --> factor(3 level: "1", "2", "3")
$ Age --> integer(eg. 24,54,etc.)
$ Mortality --> integer(0=no,1 = 是)
$ LDL --> 整数(例如 200,120,143 等)
$ 吸烟 --> 整数(0=否,1= 是)
我在 twang 包中使用了 mnps 函数来根据治疗来衡量我的观察结果
mnps代码
``` ### 绘图###
然后我使用绘图功能来评估加权后的数据平衡。图 1 和图 2 没有问题(每次迭代的治疗平衡,以及治疗的倾向得分分布。)
情节代码
但是当我想为绝对标准化差异运行图 3 时,它出现了一些警告和空白图的错误:
警告错误
plot(mnps.dataset, plots = 3)
警告信息:
___________________
注意:“...”表示重复先前的错误
r - 如何使用 PerformanceAnalytics 计算具有 NA 的等权重投资组合回报?
我正在努力计算等权重的投资组合回报。我目前正在Return.portfolio
从PerformanceAnalytics
包中使用,在处理 NA 时遇到问题。
举一个可复制的例子:
当我运行时Example$PF.return <- Return.portfolio(Example[,1:3], geometric = F)
,我得到一个警告读数In Return.portfolio(Example, geometric = F) : NA's detected: filling NA's with zeros
,实际上结果PF.return.wrong
包括计算中的 NA 作为零。
我确实希望得到结果PF.return.expected
。
我想要做的是从投资组合回报计算中排除 NA。但是我无法做到这一点。
作为一种潜在的解决方法,我考虑过可能return.portfolio
与下面的加权矩阵 Example.wt 结合使用:
运行Example$PF.return.weighted <- Return.portfolio(Example[,1:3], geometric = F, weights = Example.wt)
我遇到三个问题:
- 由于某种原因 PF.return.weighted 的第一行返回 NA
- 第四行的值不等于 PF.return.expected 我不明白为什么
- 是手动构建的
Example.wt
,因为我没有设法计算它。
您是否知道为什么 PF.return.weighted 存在 NA 以及为什么第四行值与预期值不同?
至于权重矩阵的计算,你知道我是怎么自动计算出来的Example
吗?我考虑过使用 and 的某种组合,rowSums
但!is.na()
没有设法构建它。
很抱歉这篇长帖子,但我真的被困在这里,不胜感激任何帮助/提示!提前谢谢了!