问题标签 [weighting]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
2623 浏览

sharepoint - Sharepoint 搜索属性权重

我正在使用此处列出的代码:

http://msdn.microsoft.com/en-us/library/ms553069.aspx

在设置属性后添加了附加行作为对 .update() 的调用以保存更改,但即使权重为 10,000,我的属性的搜索结果仍位于底部,尤其是在标题下方。为了使权重传播,是否还需要做一些其他的事情?

我还尝试将标题、作者和文件名设置为 0,将属性(关键字)设置为 9999,并将属性的长度规范化设置为 0。结果略有变化,但使用与属性匹配的关键字进行搜索仍然不符合。

所有测试都在之后完全爬网完成,重置 IIS,并回收共享服务应用程序池。

我可以给你任何你可能要求的额外信息。

谢谢,斯特凡

更新 (6-19-09):为此增加了 500 的赏金。在线提供的有关此功能的信息很少,显然一个好的答案将为互联网社区提供巨大的服务。它可能也可以为我节省一个星期:)

更新 2 (6-19-09):架构本质上是这样的:OOB 共享点文档内容类型,添加了文本字段“关键字”。附加到 ows_keywords(Text) 的托管属性。

更新 3 (6-19-09):Codeplex 的 Sharepoint Search Bench 对搜索有很大帮助。

更新 4 (6-19-09):我已经找到了一个解决方案,该解决方案涉及创建许多(现在 5 个)具有相同爬网属性的更多托管属性。每个权重都设置为不寻常的值(例如 9999)。这些足以将关键字结果提升到顶部。虽然不太理想。仍在寻找解决方案。

更新 4 中的解决方案是我最终得到的。正如 Lars 评论的那样,搜索不是很灵活,尽管对属性权重进行了调整,但效果并不总是您所期望的。

0 投票
4 回答
344 浏览

php - 基于 2 种类型变量(在 php 中)实现加权随机选择的最佳方法是什么?

基本上我的困境是这样的。我有一个托管文件的 x 服务器列表。还有另一台服务器,托管该站点的 mysql 数据库和应用程序。当文件被上传(到前端服务器)时,应用程序会检查哪个服务器上的可用空间最多,并将文件移动到那里。如果您从 2 台以上具有相同可用空间的空服务器开始,这将正常工作。如果您稍后将另一台服务器引入混合中......它将比当前服务器拥有更多的可用空间,这种方法不是那么有效,因为所有新文件都将难以捉摸地上传到新服务器,这会超载因为它将处理大部分新流量,直到它在可用空间方面赶上其余的盒子。

所以我也想引入一个加权系统,这将有助于规范文件的分布。因此,如果 3 台服务器分别设置为 33%,并且其中 1 台服务器的可用空间显着增加,它仍然会比其他服务器获得更多的上传(即使它具有相同的权重),但负载会分散到所有服务器上服务器。

任何人都可以建议一个好的 php-only 实现吗?

0 投票
2 回答
255 浏览

c# - 根据另一个数据库表中的权重对 GridView 进行排序

我有一个从我们内部使用的非 SQL 数据库填充的 GridView。其中一个领域是储藏室位置。(例如:AAA、AAB、AAC 等)

在另一个数据库 (SQL) 中,我保留了所有库房的列表并给它们一个权重。权重只是一个整数;整数越大,库房越远。

我需要根据这些库房重量对我的 GridView 进行排序。如何让我的 GridView 排序依赖于另一个表中的数据?这似乎应该是一个简单的解决方案,但我被卡住了。如果重要,GridView 绑定到 System.Collections.ObjectModel.Collections<> 类。

0 投票
6 回答
373 浏览

c++ - C ++中的加权RNG速度问题

编辑:澄清一下,问题出在第二种算法上。

我有一些 C++ 代码可以从 52 张卡片组中采样卡片,效果很好:

我正在实现代码以根据已知分布(存储为二维表)对底牌进行采样。我的代码如下:

我的问题?加权采样算法慢了 10 倍。速度对我的应用程序非常重要。

有没有办法将我的算法速度提高到更合理的程度?我在实施中做错了吗?

谢谢。

编辑:有人问我这个功能,我应该发布的,因为它是关键

}

...而 i2h() 基本上只是一个数组查找。

0 投票
1 回答
90 浏览

random - 随机选择与最近的先前选择加权

我想选择列表中的一个元素,其中每个元素的权重是自上次选择以来的时间。

我可以制作一个 LRU(最近最少使用)列表,并根据队列中的位置对函数进行加权,这将是优雅的,除了最初所有元素的权重应该相等。

只是在选择权重后将权重减去或除以一定数量在直觉上似乎是不正确的。有没有更好的方法可能使用对数或倒数等数学概念?(不是我的强项)

0 投票
2 回答
2072 浏览

statistics - 分数/评分的算术平均值的替代方法

算术平均值或平均值很容易实现,因为它通常作为函数集成在大多数编程语言中。

但是,这并不适合评级,因为 10 分中有 5 分会“拉低”平均值,而单个评分(例如 8 分)会给出更高的平均值。

在让您对图片或人物进行评分的网站上,通常会进行什么计算?我假设权重被赋予了更高数量的评级。

0 投票
2 回答
1671 浏览

python - 用于权重调整的机器学习

我正在尝试研究如何实现一些机器学习库,以帮助我找出每个参数的正确权重,以便做出正确的决定。

更详细地说:

上下文:尝试为 html 文件实现发布日期提取器。这是针对新闻网站的,所以我没有可以使用的通用日期格式。我在 python 中使用 dateutil 中的解析器,它做得很好。我最终得到了一个可能的发布日期列表(html 文件中的所有日期)。

从一组参数中,例如关闭标签、靠近日期子字符串的单词等。我根据发布日期的可能性对列表进行排序。每个参数的权重都是有根据的猜测。

我想实现一个机器学习算法,在训练(提供实际发布日期)之后,它确定每个参数的权重应该是多少。

我一直在阅读 python 中不同机器学习库的文档(pyML、scikit-learn、pybrain),但我没有发现任何有用的东西。我也读过这篇文章,有一个很接近的例子来确定蘑菇是否可以食用。

注意:我在 python 中工作。

非常感谢您的帮助。

0 投票
1 回答
235 浏览

android - Android ImageViews 在加权时无法正常工作

这段 XML 将正确显示一个覆盖整行的按钮,然后是 2 个按钮,它们的权重均匀并共享 50% 的空间,如下所示:

我想用 ImageView 替换 Button A,它会像 Button A 当前一样延伸。但是,当您将 ButtonA 替换为:

这会影响按钮 B 和 C 的权重,使按钮 B 覆盖大部分屏幕并使 C 真正被压扁。它似乎与图像的尺寸有关(我使用的是 320x50)。

如何在不影响其余表行的情况下插入此 ImageView?

0 投票
0 回答
509 浏览

python - PyLucene 的对数似然比统计

目前我正在分析大量的文本。我想对两个词表执行对数似然比,以识别前景语料库与规范语料库中术语的频率偏差。我已经在 Python 中编写了对数似然编码,但是在二元组上运行代码会导致计算机速度慢和等待时间长。我刚刚读到我可以使用 PyLucene 索引我的语料库,这将加快语料库上的运行任务。有足够的文档如何索引,但我在某个地方读到了 PyLucene 中存在的对数似然比函数。有人知道这个功能吗?提前致谢。

0 投票
2 回答
81 浏览

mysql - 按顺序使用最大列值

我正在尝试按两列排序表格,每列都有不同的权重。第一个是uptime,它是一个介于 0 和 1 之间的值,权重为 0.3。第二个是votes,它是一个非负整数,权重为 0.7。

权重需要乘以 0-1 之间的值,因此我将通过将每行的投票数除以任何行的最大投票数来获得投票。

到目前为止,这是我的查询,它几乎可以工作:

100 是硬编码的,应该是 的最大值votes。UsingMAX(votes)使查询仅返回投票数最高的记录。这可以在单个查询中完成吗?