问题标签 [xgboost]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
7 回答
30056 浏览

python - anaconda 的 xgboost 安装问题

我正在使用蟒蛇。我首先切换到 Python2(版本 2.7.11)。

我使用以下命令在 anaconda 中安装 xgboost。

然后我检查了是否安装了 xgboost。

我在终端中运行 python,导入 xgboost 并得到以下错误。

我不知道下一步该做什么。

0 投票
1 回答
433 浏览

python - 从 xgboost 中的 DMatrix 实例中检索设计矩阵

在 xgboost 中,我正在做类似的事情

如果我想从 dtrain 中提取 y 值作为数组,我可以这样做

有没有办法从 dtrain 中提取 X 值作为数组?

0 投票
2 回答
2339 浏览

python - 尝试在 Windows 上的 python 中安装 xgboost

我一直在让自己发疯,试图在 Windows 10 上的 python 中安装 xgboost。我浏览了几篇建议的文章,但似乎仍然找不到合适的解决方案。如果有人在此之前做过此操作,请分享您的方法,也欢迎其他建议。

谢谢

0 投票
0 回答
747 浏览

c++ - 从 C++ 中的文件加载 DMatrix(xgboost 包)

我使用 xgboost R 包来训练模型。我想在 C/C++ 环境中进行预测。我成功地从 R 中保存了训练好的模型并将其加载到我的 C 代码中。

我想通过保存我在 R 中使用的测试数据(作为 DMatrix)来测试这段代码,并将其加载回我的 C 程序中,然后进行预测。

在 RI 中使用 xgb.Dmatrix.save() 命令将测试数据保存到文件中。我的 C 代码如下所示:

此代码编译,但在运行时失败并出现以下错误:

dmlc-core/include/dmlc/logging.h:245: [13:57:27] src/data/data.cc:51: 检查失败: (version) == (kVersion) MetaInfo: 格式无效

关于如何告诉 xgboost 以正确的格式保存/加载内容的任何建议?

任何线索都会有所帮助。

0 投票
2 回答
5328 浏览

r - sparse.model.matrix 和 as.matrix 的区别

我在 R 中使用 xgboost 在训练数据集上构建分类模型traintrain具有以下属性。

  1. 它具有所有数字功能
  2. 没有缺失值。
  3. 不存在分类/文本/因子变量。
  4. TARGET是取 1/0 值的目标变量。

xgb.train 需要以特定格式传递数据,因此我尝试了以下两种方法来获取 xgb.train 所需的格式。

1.

2.

现在,当我使用这两种xgtrain创建方法构建的模型对测试集进行评分时,我会得到不同的分数/AUC。我已经验证这不是随机化的问题,因为如果我运行第一种方法或第二种方法两次/三次,我能够重现分数。在我无法弄清楚的两种方法中发生的事情有所不同。有人可以帮我找出区别吗?

换句话问。 与提供给他们的数据只有数字特征、没有缺失值和分类变量时有什么不同sparse.model.matrixas.matrix

0 投票
2 回答
6704 浏览

python - Windows xgboost 错误

只是安装 xgboost 库很痛苦,但现在在 Windows 8.1 64 位上发生了其他错误

可以做什么?我认为这是因为 .py 文件在 Windows 中的关联方式我猜

0 投票
1 回答
1384 浏览

r - 是否可以在 R 中使用 xgboost (xgb.cv) 交叉验证和保存交叉验证的模型?

R 中几乎所有的机器学习包/函数都允许您在训练模型时获得交叉验证性能指标。

据我所知,使用 xgboost 进行交叉验证的唯一方法是设置xgb.cv如下语句:

但即使有这个选项,prediction = T你也只是从你的训练数据中得到预测结果。我看不到在包含新数据的语句中使用结果对象(clf在本例中)的方法。predict

我的理解是否准确,是否有任何解决方法?

0 投票
2 回答
4770 浏览

r - R中xgboost模型的部分依赖图

是否有一个已经存在的函数可以从 R 中的 xgboost 模型中获取部分依赖图?我看到了使用包的例子mlr,但它似乎需要一个mlr特定的包装类。我有点不清楚是否有办法将xgboost模型转换为该类。

0 投票
1 回答
945 浏览

r - 访问 xgboost r 包中的监视列表历史记录

我正在使用 xgboost R 包来执行多类分类任务。这是我为说明问题而创建的一段代码(输入和输出是随机生成的,因此结果当然没有意义,这是我所做的只是为了玩耍并学习如何处理包):

这可以按预期工作并产生预期的结果,这里有几行:

我无法实现的是存储这些值以供以后使用。是否有可能做到这一点?调整参数会很有帮助。

PS 我知道我可以使用包中包含的交叉验证方法 xgb.cv 来获得类似的结果;但我宁愿使用这种方法来更好地控制发生的事情,而且,由于这些指标是计算出来的,在我看来,除了在屏幕上阅读之外,没有可能使用它们,这似乎是一种计算能力的浪费。

0 投票
1 回答
226 浏览

xgboost - Xgboost 节点分裂的值超出了特征范围?

我有一些从 0 到 1 的特征。但是当我转储模型时,我发现一些节点使用“特征 < 2.00001”分割这些特征。xgboost 是否会扩展该功能或为该功能增加一些价值?或者为什么选择2.00001进行拆分?谢谢~