问题标签 [weighting]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - gw_idf 给出的输出维度与文档中所述不同
在 R 中,我使用gw_idf()
文档术语矩阵的加权方案(每行代表一个文档,每列代表一个唯一的单词),它是lsa
库的一部分。在包文档(第 23 页)中,声明:
' gw_idf() 在 xm矩阵中返回逆文档频率。每个单元格是 1 加上文档数量的对数除以出现该术语的文档数量。'
但是,当我运行以下代码时:
gw_idf
now 是一个长度等于文档数量的向量。
所以,如果我理解正确的话:文档说明输出应该是一个矩阵,而我得到的输出是一个向量。我对文档的解释在这里不正确吗?还是文档不正确?
r - 按州人口规模的加权面板回归
我目前正在研究美国州年度调查数据,这是每年和州的一次观察。现在,我想说明该州不同的人口规模。
什么是加权回归的正确方法 - 第一个或第二个:
另外,我正在考虑在survey
包的帮助下实现回归。尽管如此,我仍然不完全理解为什么标准错误会有所不同。
r - 使用 R 中的调查包堆叠多个设计术语
我试图了解如何使用survey
R 中的包组合多个设计。例如,要构建测量权重,我需要进行分层、校准、修剪权重和重新校准。
我尝试按以下顺序堆叠设计术语:
(我将后分层作为一个单独的步骤的主要原因是因为有 13 个后层。有些后层很小,所以我担心将后分层变量折叠成 raking 会导致收敛问题。)
我真的很想知道这是否是正确的方法以及是否有更简洁的方法。谢谢!
python - 通过不确定性使用权重进行特征选择
有什么方法可以通过 Python 中的不确定性来实现特征加权,就像在 RapiMiner 中所做的那样:https ://docs.rapidminer.com/latest/studio/operators/modeling/feature_weights/weight_by_uncertainty.html ?
r - 边际结构模型:如何将时变治疗和过去治疗的条件结合起来
这是我在 stackoverflow 上的第一篇文章。我试图根据指南提出问题。
我目前正在研究一个边际结构模型。我已经阅读了 Hernan 关于这个主题的大部分文章,并阅读了他的书What if和提供的 R 代码。但是,我发现的所有示例都相当简单。例如,患者在随访开始时接受或不接受治疗 A 并在整个期间保持该治疗。我发现很难将我学到的知识应用到我的数据集上。
我的数据集是关于事件发生时间的数据。在患者的随访期间,他们可以接受治疗A。一些患者在随访开始时已经接受治疗A,而其他患者在随访期间较晚开始或根本不接受治疗。此外,正在接受治疗A的患者可以在他们的随访期间停止治疗并再次重新开始治疗,即随时间变化的治疗。
在这里,我提供了一个示例数据集,其中包含事件时间数据的粗略 MSM 代码。我使用合并逻辑回归代替 Cox PH 回归,其优势比类似于 Cox 模型的风险比。为简单起见,我没有计算审查权重。
然而,在上面的例子中,权重不考虑以前的治疗史和随时间变化的混杂因素治疗史。所以我的问题是,如何将这些历史纳入时变治疗。Fewell等人的这篇文章。描述了针对时变治疗但患者无法退出并重新开始治疗的方法。我引用:
为了估计每个受试者到每个月的完整治疗史的概率(3中的分母),我们将每个月观察到的治疗的估计概率乘以时间累积。每个受试者的第一个估计概率保持不变。对于所有其他情况,当前时间点的估计概率乘以前一个时间点的估计概率。[Fewell Z,Hernán MA,Wolfe F,Tilling K,Choi H,Sterne JAC。使用边际结构模型控制时间相关的混杂。统计杂志。2004;4(4):402-420。doi:10.1177/1536867X0400400403]
从他们文章的代码中可以看出,一旦患者开始治疗,他们的权重就设置为 1。我知道很多人用来计算权重的另一种方法是ipw 包。但是,当患者开始治疗时,此软件包还将权重设置为 1,之后权重也保持为 1。
ipw 包的一位作者也为Grafféo 等人的文章做出了贡献。它扩展了 ipw 包以允许随时间变化的权重。他们通过计算在不接受治疗时开始治疗的权重和在接受治疗时停止治疗的权重来做到这一点。(代码可作为文章中的支持信息)但是,他们没有考虑治疗的历史/随时间变化的混杂因素。
更准确地说,我们没有考虑混杂治疗暴露的整个历史,而只是认为在时间 t 的感兴趣的暴露仅取决于在时间 t 给出的混杂治疗。然后,不是计算直到第一次修改感兴趣的曝光时的权重,而是计算所有时间点的权重,即,计算感兴趣状态处理的所有变化和所有事件时间的权重。[Grafféo, N, Latouche, A, Geskus, RB, Chevret, S. 使用治疗权重的反概率对时变暴露进行建模。生物识别杂志。2018; 60: 323–332. https://doi.org/10.1002/bimj.201600223]
他们为此提出以下建议
我们没有考虑混杂因素的历史。对于感兴趣的暴露和混杂因素之间的关系中的每个转换,可以使用不同的模型来解决这个问题。需要进一步的工作来研究这种建模选项。最简单的方法是将先前暴露的计数器作为协变量包含在治疗模型中。[Grafféo, N, Latouche, A, Geskus, RB, Chevret, S. 使用治疗权重的反概率对时变暴露进行建模。生物识别杂志。2018; 60: 323–332. https://doi.org/10.1002/bimj.201600223]
因此,Fewell 的方法确实结合了治疗和随时间变化的变量历史,但不允许在开始治疗后改变体重。Grafféo 的方法确实允许权重随时间变化,但不包含处理和随时间变化的变量历史。所以我真正想要的是结合这些方法,但我绝对不知道这怎么可能。
我希望我的问题很清楚(并且问得正确)并且有人有建议。谢谢!
r - 有没有更有效的方法在 R 中创建权重?
我正在尝试根据数据集中变量值的不同组合的数量为分析创建权重。我尝试使用distinct()
andcount()
函数,但是行的顺序被打乱了(与 using 相同rle()
。下面的函数以正确的顺序准确地计算权重,但效率不高。有没有办法让它更快?谢谢!
r - 通过倾向得分的倒数加权后的协变量平衡
我的分析侧重于因果推理。我使用倾向得分的倒数来形成权重(倾向得分是在给定一组协变量的情况下接受治疗(或干预)的概率)。我的问题是,有谁知道我如何在加权前后对协变量进行平衡评估?我知道有一些包可以做到这一点,但我想手工编写而不是使用包。这是一个例子:
就是看协变量在与倾向得分的倒数加权后是否平衡(我知道大体的想法但不熟悉其背后的理论)
r - 当某一治疗类别的权重为 0 时,加权后的协变量平衡
我正在尝试使用“钴”包来评估倾向得分加权后的协变量平衡,但我的问题是那些没有得到治疗的人的权重为 0(这是我们设计它的方式,我们无法改变它应该是这样的),所以当我想使用它时它说:
当我对那些“治疗”=1 的人进行“治疗”子集时,它说:
有没有人遇到过这种情况?修复此错误的任何提示或技巧?
python - 形状 (n_clusters, n_features) 指的是什么?以及如何使用它?
我已经从数据 txt 加载了一个数据集。在我的案例中,数据集已经通过了文本预处理和术语加权。如果我使用的数据集来自矩阵(术语权重的输出),我对如何使用另一个数据形状(如数组)感到非常困惑:
3d - Cinema 4D 中的权重问题——我该如何解决?
更新 所以我终于想出了如何使权重可见,但现在我可以看到当我选择前肩关节时后腿关节上没有颜色,但它仍在移动错误的多边形。有谁知道为什么?
所以就绑定和动画而言,我对 Cinema 4D 相当陌生。我在这里建模了一个相当不错的野兽,但是(在花了几个小时试图弄清楚如何正确装配它之后)现在它已经装配好了,当我移动一个关节(即膝关节)时,它需要从后腿和伸展他们都像摇摇晃晃的一样。我对其他关节也有同样的问题,比如头部、颈部底部和肩关节。
我认为它与加权有关,但我似乎根本无法解决它。我尝试使用权重工具从受影响的多边形中减去权重,但即使是附近我不想移动的那些(胸部和肋骨周围)似乎也不受权重工具的影响。然后其他时候呢?就像鹿角没有用头转动,但是当我用重量工具增加重量时,他们做了,但现在重量工具似乎无效。另外,我看不到权重的应用位置(没有颜色),我也不确定这是怎么回事。当我看到其他人在教程中绑定他们的装备时,颜色只是显示以显示权重,但对我来说不是这样。
我试过的:
我尝试选择肘关节并去除重量,我选择了肘部和肩部工具,当我减去重量时,这似乎消除了一些影响,但没有消除对后腿的影响。我试过选择整条腿,重量工具没有效果。
我的问题:
如何显示权重颜色,以便我可以看到我正在使用权重工具绘制/减去的内容,以及如何阻止错误的多边形受到影响?(在图像中,我选择并旋转了肩关节和肘关节)。我相信我使用的是最新版本的 Cinema4D