“weighting”的相关标签问题

0 投票

2 回答

669 浏览

data-mining - 对加权特征向量进行分类

我想在任何分类算法（如 KNN 或 J48）中使用特征之前给数据集的特征赋予权重，但我不知道如何评估加权特征向量。
是否有任何分类算法接受权重作为输入，而不仅仅是“0”和“1”？
特别是，Weka 的任何现成分类函数是否能够使用权重（不是 0 和 1 作为过滤器）？

2012-07-15T13:56:25.447

0 投票

5 回答

138 浏览

python - 如何创建具有可变参数的 Python 函数

我想在 Python 中创建一个加权函数。但是权重的数量会有所不同，我需要该函数具有可选参数（例如，您可以找到 and 的成本weightA，weightB但您也可以找到以上所有内容。

基本功能如下所示：

如何更改功能，以便例如也可以称量体积 C 和体积 D？

提前谢谢！

python function weighting

2013-02-13T00:51:52.673

0 投票

2 回答

655 浏览

r - Having weights shown as an unused argument in logistf R function

I kept getting a problem for the following code; "weights=weight" was shown as an unused argument. How should I solve the problem?

Also, is there a way to perform the whole process shown above 30, 60, or 100 times and generate time (or count), x_0, x_1, and result for each time? Any suggestion would be great. Thanks.

r statistics linear-regression weighting logistf

2013-05-04T17:12:18.067

0 投票

1 回答

261 浏览

oracle10g - Oracle Text：如何不计分查询的一部分？

我有一个使用 Oracle Text 索引的多列数据存储，并且我正在使用 Contains 关键字运行查询。
为了对不同的列进行不同的加权，我进行如下操作。

如果用户搜索“可怕”，则向 oracle 发出的查询将如下所示：

但是要添加一个也被索引的类别过滤器，我这样做：

这会按类别过滤，但这会完全打乱评分，因为 Oracle 文本将从 AND 关键字的任何一侧获得最低分数。相反，我想指示 oracle 忽略 AND 的右侧。

有没有办法让评分忽略查询的这个特定部分？

基本上，我想根据

但我想根据

oracle10g scoring oracle-text weighting

2013-05-24T12:15:17.170

0 投票

1 回答

2483 浏览

javascript - 数组中的分桶数

我有一个数字列表，例如 1 到 60，但不一定以 1 为增量。例如，1-40 以 1 为增量，40-60 以 2 为增量。

我有另一组定义的数字（桶）——例如 2、3、5、10、30、50

我需要生成一个二维数组，其中每个数字（1 到 60）适合哪个桶的百分比。

让这更简单：假设我们有数字 1 到 10，以及桶 2、3、5、10

我希望我的二维数组看起来像这样：

在此处输入图像描述

我可以用一堆条件来做到这一点，但我认为有一个我没有想到的解决方案，如果有人能阐明一下，那就太好了！我需要在 JavaScript 中执行此操作，但是任何语言都可以帮助我尝试理解任何比许多 if 决定每个数字适合的位置然后为每个单元格执行 (6-5/10-5)=0.2 更优化的解决方案。

我试图避免对存储桶 2、3、5、10 进行硬编码，以便任何一组存储桶或数字都可以完成这项工作。

编辑： 首先，对于不完整的描述，我很抱歉 - 我当时在手机上，无法通过计算机在 stackoverflow 上发帖。

1-10 和 2,3,5,10 都代表年份。实际上，我试图每年从 1 到 10。

第 1 年 100% 进入 Bucket 2 - 我想这个单元格没有特定的公式
第 2 年 100% 进入 Bucket 2 - 也没有具体公式
第 3 年 100% 进入存储桶 3 - 3==3
第 4 年在存储桶 3 之间分配一半，在存储桶 5 之间分配一半。计算公式为：（第 4 年 - 第 3 年）/（第 5 年 - 第 3 年）= 0.5
- 第 5 年 100% 进入存储桶 5。
- 第 6 年，80% 进入桶 5，20% 进入桶 10。这个公式是：1-(6-5)/(10-5)=0.8 和它的相邻单元格 (6-5)/( 10-5)
- ...等等...

我希望这能让它更清楚。

javascript arrays weighting

2014-09-15T09:18:42.473

0 投票

1 回答

803 浏览

android - 如何在 SPL Meter 中实现时间加权？

我想开发一个 android 应用程序来测量声压级，但我不确定如何实现时间加权。目前我的算法工作如下：

录制 20 毫秒的音频（160 个样本 @ 8000Hz）
计算 RMS
计算 SPL
更新显示值并重新开始

在这里你可以看到算法的主要部分：

我知道声级计的等级可以是快速、慢速或脉冲时间加权。但我不确定在我的算法中如何以及在何处实现这个时间加权。

问：时间加权是否意味着在什么时间之后我会更新测量的 dB 值？

问：我应该简单地将更新间隔更改为 125 毫秒以获得快速加权结果还是我完全错了？

谢谢你的支持

android decibel weighting

2014-10-07T12:14:40.223

0 投票

1 回答

2494 浏览

r - 使用调查权重时，如何为 logit 模型生成边际效应？

我通常使用 mfx 包和 logitmfx 函数生成 logit 模型边际效应。但是，我正在使用的当前调查具有权重（由于在某些人群中过采样，这对样本中 DV 的比例有很大影响），并且 logitmfx 似乎没有任何方法包含权重。

我已经为模型安装了 svyglm，如下所示：

如何从这些结果中产生边际效应？

r glm survey weighting marginal-effects

2014-10-20T14:41:10.227

0 投票

0 回答

204 浏览

r - Explaining methodolgy behind this ARIMA weighted code

I have a code that was given to me that runs an ARIMA model putting weight on more recent errors, it gives excellent results, much better than simple ARIMA, but i do not understand the methodology behind it. If you can understand whats going on and why and how it works then i would really appreciate it :)

The code that i would like explaining is from the #---Weighting---

r time-series weighting

2014-11-10T17:05:56.000

0 投票

1 回答

1153 浏览

r - 加权 k 表示按观察次数聚类

我想使用 R 中的 k 均值对一些数据进行聚类，如下所示。

“SUMALL”列是在数据中观察到特定变量组合的次数。

因此，当使用 k 表示时，我希望能够将此列用作该特定组合的“权重”，以便频繁组合变得更加重要（也使集群特征作为加权平均值给出）。

我在标准包中看不到执行此操作的简单方法cluster，任何人都可以建议是否有一种简单的方法可以执行此操作？

r cluster-analysis k-means weighting

2014-11-19T12:53:49.700

0 投票

1 回答

605 浏览

r - R函数根据对手的实力加权球队？

我正在分析一些体育数据，我有一组大约 40 支球队的输赢记录。我想提出一个排名，其中每场胜利都取决于对手的实力。这必须是某种迭代/递归的东西，其中权重和等级在每次迭代时都会更新，直到收敛。有谁知道是否有现有的功能或包来做这种事情？我的猜测是它不会是一个特定于运动的包，但我想这种事情在很多领域都很常见。

编辑：

这是一些示例数据。有 4 支队伍，A、B、C 和 D，每支队伍与另一支队伍交手一次，产生 10 场独特的比赛。数据加倍，因此每支球队的四场比赛都被列为自己的行，列“a.win”指的是“team.a”是否赢得了比赛（1=是）。

从这些数据来看，A队赢了3/4，B队赢了1/4，C、D、E各赢了2/4。但是 D 队击败了 A，而 C 和 E 都输给了 A。所以直觉上 D 的排名应该略高于 C 和 E，因为它的胜利之一是得分最高的对手。同样的，C队输给了B队（唯一只赢过的队伍），所以直觉上应该排在D和E的后面。

我试图弄清楚如何最好地分配排名（例如，从 -1 到 1，或基于获胜概率或失败次数等），然后如何最好地重新加权每个团队，而不仅仅是基于赢/输的数量，但取决于他们击败的对手的排名。

r ranking ranking-functions weighting

2015-02-09T14:39:52.970

问题标签 [weighting]

Reference