问题标签 [weighting]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
669 浏览

data-mining - 对加权特征向量进行分类

我想在任何分类算法(如 KNN 或 J48)中使用特征之前给数据集的特征赋予权重,但我不知道如何评估加权特征向量。
是否有任何分类算法接受权重作为输入,而不仅仅是“0”和“1”?
特别是,Weka 的任何现成分类函数是否能够使用权重(不是 0 和 1 作为过滤器)?

0 投票
5 回答
138 浏览

python - 如何创建具有可变参数的 Python 函数

我想在 Python 中创建一个加权函数。但是权重的数量会有所不同,我需要该函数具有可选参数(例如,您可以找到 and 的成本weightAweightB但您也可以找到以上所有内容。

基本功能如下所示:

如何更改功能,以便例如也可以称量体积 C 和体积 D?

提前谢谢!

0 投票
2 回答
655 浏览

r - Having weights shown as an unused argument in logistf R function

I kept getting a problem for the following code; "weights=weight" was shown as an unused argument. How should I solve the problem?

Also, is there a way to perform the whole process shown above 30, 60, or 100 times and generate time (or count), x_0, x_1, and result for each time? Any suggestion would be great. Thanks.

0 投票
1 回答
261 浏览

oracle10g - Oracle Text:如何不计分查询的一部分?

我有一个使用 Oracle Text 索引的多列数据存储,并且我正在使用 Contains 关键字运行查询。
为了对不同的列进行不同的加权,我进行如下操作。

如果用户搜索“可怕”,则向 oracle 发出的查询将如下所示:

但是要添加一个也被索引的类别过滤器,我这样做:

这会按类别过滤,但这会完全打乱评分,因为 Oracle 文本将从 AND 关键字的任何一侧获得最低分数。相反,我想指示 oracle 忽略 AND 的右侧。

有没有办法让评分忽略查询的这个特定部分?

基本上,我想根据

但我想根据

0 投票
1 回答
2483 浏览

javascript - 数组中的分桶数

我有一个数字列表,例如 1 到 60,但不一定以 1 为增量。例如,1-40 以 1 为增量,40-60 以 2 为增量。

我有另一组定义的数字(桶)——例如 2、3、5、10、30、50

我需要生成一个二维数组,其中每个数字(1 到 60)适合哪个桶的百分比。

让这更简单:假设我们有数字 1 到 10,以及桶 2、3、5、10

我希望我的二维数组看起来像这样:

在此处输入图像描述

我可以用一堆条件来做到这一点,但我认为有一个我没有想到的解决方案,如果有人能阐明一下,那就太好了!我需要在 JavaScript 中执行此操作,但是任何语言都可以帮助我尝试理解任何比许多 if 决定每个数字适合的位置然后为每个单元格执行 (6-5/10-5)=0.2 更优化的解决方案。

我试图避免对存储桶 2、3、5、10 进行硬编码,以便任何一组存储桶或数字都可以完成这项工作。

编辑: 首先,对于不完整的描述,我很抱歉 - 我当时在手机上,无法通过计算机在 stackoverflow 上发帖。

1-10 和 2,3,5,10 都代表年份。实际上,我试图每年从 1 到 10。

  • 第 1 年 100% 进入 Bucket 2 - 我想这个单元格没有特定的公式
  • 第 2 年 100% 进入 Bucket 2 - 也没有具体公式
  • 第 3 年 100% 进入存储桶 3 - 3==3
  • 第 4 年在存储桶 3 之间分配一半,在存储桶 5 之间分配一半。计算公式为:(第 4 年 - 第 3 年)/(第 5 年 - 第 3 年)= 0.5
    • 第 5 年 100% 进入存储桶 5。
    • 第 6 年,80% 进入桶 5,20% 进入桶 10。这个公式是:1-(6-5)/(10-5)=0.8 和它的相邻单元格 (6-5)/( 10-5)
    • ...等等...

我希望这能让它更清楚。

0 投票
1 回答
803 浏览

android - 如何在 SPL Meter 中实现时间加权?

我想开发一个 android 应用程序来测量声压级,但我不确定如何实现时间加权。目前我的算法工作如下:

  1. 录制 20 毫秒的音频(160 个样本 @ 8000Hz)
  2. 计算 RMS
  3. 计算 SPL
  4. 更新显示值并重新开始

在这里你可以看到算法的主要部分:

我知道声级计的等级可以是快速、慢速或脉冲时间加权。但我不确定在我的算法中如何以及在何处实现这个时间加权。

问:时间加权是否意味着在什么时间之后我会更新测量的 dB 值?

问:我应该简单地将更新间隔更改为 125 毫秒以获得快速加权结果还是我完全错了?

谢谢你的支持

0 投票
1 回答
2494 浏览

r - 使用调查权重时,如何为 logit 模型生成边际效应?

我通常使用 mfx 包和 logitmfx 函数生成 logit 模型边际效应。但是,我正在使用的当前调查具有权重(由于在某些人群中过采样,这对样本中 DV 的比例有很大影响),并且 logitmfx 似乎没有任何方法包含权重。

我已经为模型安装了 svyglm,如下所示:

如何从这些结果中产生边际效应?

0 投票
0 回答
204 浏览

r - Explaining methodolgy behind this ARIMA weighted code

I have a code that was given to me that runs an ARIMA model putting weight on more recent errors, it gives excellent results, much better than simple ARIMA, but i do not understand the methodology behind it. If you can understand whats going on and why and how it works then i would really appreciate it :)

The code that i would like explaining is from the #---Weighting---

0 投票
1 回答
1153 浏览

r - 加权 k 表示按观察次数聚类

我想使用 R 中的 k 均值对一些数据进行聚类,如下所示。

“SUMALL”列是在数据中观察到特定变量组合的次数。

因此,当使用 k 表示时,我希望能够将此列用作该特定组合的“权重”,以便频繁组合变得更加重要(也使集群特征作为加权平均值给出)。

我在标准包中看不到执行此操作的简单方法cluster,任何人都可以建议是否有一种简单的方法可以执行此操作?

0 投票
1 回答
605 浏览

r - R函数根据对手的实力加权球队?

我正在分析一些体育数据,我有一组大约 40 支球队的输赢记录。我想提出一个排名,其中每场胜利都取决于对手的实力。这必须是某种迭代/递归的东西,其中权重和等级在每次迭代时都会更新,直到收敛。有谁知道是否有现有的功能或包来做这种事情?我的猜测是它不会是一个特定于运动的包,但我想这种事情在很多领域都很常见。

编辑:

这是一些示例数据。有 4 支队伍,A、B、C 和 D,每支队伍与另一支队伍交手一次,产生 10 场独特的比赛。数据加倍,因此每支球队的四场比赛都被列为自己的行,列“a.win”指的是“team.a”是否赢得了比赛(1=是)。

从这些数据来看,A队赢了3/4,B队赢了1/4,C、D、E各赢了2/4。但是 D 队击败了 A,而 C 和 E 都输给了 A。所以直觉上 D 的排名应该略高于 C 和 E,因为它的胜利之一是得分最高的对手。同样的,C队输给了B队(唯一只赢过的队伍),所以直觉上应该排在D和E的后面。

我试图弄清楚如何最好地分配排名(例如,从 -1 到 1,或基于获胜概率或失败次数等),然后如何最好地重新加权每个团队,而不仅仅是基于赢/输的数量,但取决于他们击败的对手的排名。