问题标签 [boosting]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
625 浏览

tree - XGBoost - 学习率

我正在使用 XGBoost 进行一些实验。我将迭代次数设置为 1000 并得到结果 - 合理的..

比我尝试做一些不同的事情:

而不是运行 1000 次迭代,我想运行 100 次迭代,这个重复 10 次(总共也 1000 次迭代)。在这 10 步之间,我设置了:target_learn = target_learn - target_fitted(来自上一步)。

而不是 target_fitted = target_fitted + 预测

Target_fitted 预测是通过对所有数据集的测试集进行交叉验证获得的。

我得到了不同的结果——准确度很差。

比我跑得更远,只跑了 5 次迭代,做了 200 次……甚至更糟……

我之所以尝试这样做,是因为我想在迭代期间更改学习矩阵(尝试做一些重复性的事情)。

任何想法为什么结果不同......在我看来,每一步的第一次迭代都是不同的,所以我在模型中多次迭代,这正在扼杀准确性......

其他参数一样。。

或者也许我错过了完整的东西..?谢谢

0 投票
1 回答
776 浏览

sitecore - 如何使用 Sitecore 7.5 和 Solr 4.7 提升特定领域?

我有一个名为“页面标题”的字段,它是我称为“基本标题”的基本模板的一部分。我所有的内容页面都继承了这个基本模板。我想在我的搜索结果中提升页面标题字段,以便如果在该字段中找到搜索词,它的得分高于其他匹配项。

我不知道该怎么做。我找到了 John West 的这篇博文。然而,这似乎表明为了提升一个字段我必须编辑一个配置文件?

那是对的吗?所以在 Sitecore UI 中没有办法编辑字段的提升值吗?它必须由程序员在配置文件中完成吗?

0 投票
1 回答
561 浏览

boost - Solr - 基于子文档字段提升父文档

我试图弄清楚如何根据子文档中的值来提升我的父文档。我目前正在使用 Solr 5.3,并且所有内容都已正确编入索引。这是我正在使用的文档结构:

我已经能够对子文档进行所有过滤和分面,但我无法弄清楚提升。我试过bq像下面这样进行连接,但没有运气:

bq={!parent which='type_s:Product'} availability_s:DELIVERY^2.0

另外,我将如何根据 的值进行提升price_p

我还没有找到任何关于这方面的文档,所以如果有人根据子文档进行了提升,任何帮助将不胜感激!

0 投票
1 回答
944 浏览

c# - 在 sitecore v7 中使用 Boosting item solr 进行排序

我在 sitecore 7.2 中使用 solr seach 的提升项目。我在 Boost Value 中添加了值,然后重建索引,那么如何通过提升值对结果项进行排序?我试过这样:

但它不起作用。似乎商店总是有值是 1

0 投票
1 回答
439 浏览

elasticsearch - 在 Elasticsearch 2.x 中使用 multi_match 查询对不同类型的同一字段进行不同的提升

我正在尝试按照文档中的描述执行以下操作(目前可能已过时)。

https://www.elastic.co/guide/en/elasticsearch/guide/current/mapping.html

我会将那里描述的场景调整为我想要实现的目标。

假设我们的索引中有两种类型:blog_t1 用于关于主题 1 的博客文章,而 blog_t2 用于关于主题 2 的博客文章。这两种类型都有一个标题字段。

然后,我只想将查询提升应用于 blog_t1 的标题字段。

在以前的 Elasticsearch 版本中,您可以使用 blog_t1.title 和 blog_t2.title 从类型中引用字段。所以提升其中一个就像 blog_t1.title^2 一样简单。

但是从 Elasticsearch 2.x 开始,一些旧的类型支持已被删除(有充分的理由,比如消除歧义)。此处描述了这些更改。

https://www.elastic.co/guide/en/elasticsearch/reference/current/break_20_mapping_changes.html

所以我的问题是,如何在 multi_match 查询中使用 Elasticsearch 2.x 对 blog_t1 类型而不是 blog_t2 进行标题提升?

查询将是这样的,但这显然不起作用,因为type.field不再是一个东西。

仅供参考,到目前为止,我发现的唯一解决方案是给标题起不同的名称,例如 blog_t1 的 title_boosted 和其他标题的标题,这在使用信息时是有问题的,因为我不能再使用“标题”作为独特的东西。

谢谢。

0 投票
1 回答
357 浏览

c# - Accord.NET:如何训练 Boost 分类器

我正在尝试使用 Accord.NET 库进行对象分类,但我找不到任何合适的示例,并且文档不足以理解该过程。我目前的代码是

它只是为了“可编译”而编写的,但我不知道DecisionStump的输入参数和整个第二个AdaBoost参数的本质是什么。有人可以解释一下,如何正确创建和训练Boost分类器吗?

0 投票
1 回答
47 浏览

elasticsearch - 将重点放在应该过滤器上

我正在尝试优先考虑具有主要类别的记录,而不是具有次要类别的记录,我找到了这个页面

https://www.elastic.co/guide/en/elasticsearch/guide/1.x/query-time-boosting.html这是一个我自己无法使用的基本示例。

我的工作查询:

这会返回混合的结果,我希望所有具有主要类别的东西首先出现(例如,杂货店在厨具之前)

这是我失败的尝试

0 投票
0 回答
42 浏览

classification - 如何量化树模型的相似性?(XGB、随机森林、梯度提升等)

是否有任何算法可以量化基于树的模型(例如 XGB)的相似性?例如,我用不同的数据集训练两个 XGB 模型,例如在交叉验证中,并希望估计预测的稳健性或一致性,以及可能如何使用特征。

0 投票
1 回答
4185 浏览

r - GBM模型的“有效偏差”是nan,这是什么意思以及如何摆脱它?

我正在使用梯度提升进行分类。虽然结果正在改善,但我在有效偏差中得到了 NaN。

结果

在此处输入图像描述

如何调整参数以获得有效偏差。

0 投票
0 回答
178 浏览

python-3.x - 梯度提升分类器-n_estimators

我正在为我的项目尝试梯度提升分类器。我正在使用 100 个样本。我使用了 Leave one out 交叉验证。据我所知,GBC 应该在大 n_estimators 上给出很好的结果。但是我在使用大型 n 估计器时得到的结果很低。我哪里出错了。谢谢 我尝试了以下方法:

尝试:n_estimators=100,learning_rate=1.0,max_depth=1,random_state=0 结果:Accuracy=0.635416666667 AUC=0.5703125

尝试过:尝试过:n_estimators=200,learning_rate=1.0,max_depth=1,random_state=0 结果:Accuracy=0.625 AUC=0.5546875

尝试:n_estimators=1,learning_rate=1.0,max_depth=1,random_state=0 结果:Accuracy=0.739583333333 AUC=0.6640625