问题标签 [xgboost]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - XgBoost 脚本未正确输出二进制文件
我正在学习使用xgboost
,我已经阅读了文档!但是,我不明白为什么我的脚本输出介于0~~2
. 首先,我认为它应该是 0 或 1,因为它是一个binary
分类,但后来,我读到它的概率是 0 或 1,但是,一些输出是1.5+
(至少在 CSV 上),这没有意义大部头书!
我不确定问题出在xgboost
参数上还是在 csv 创建中!这条线,np.expm1(preds)
我不确定它应该是np.expm1
,但我不知道我可以改变它!
总之,我的问题是:
为什么输出不是 0 或 1,而是 0.0xxx 和 1.xxx ?
这是我的脚本:
r - xgb.DMatrix 错误:标签的长度必须等于输入数据中的行数
我在 R 中使用 xgboost。
我使用矩阵作为输入很好地创建了 xgb 矩阵,但是当我减少矩阵数据中的列数时,我收到一个错误。
这有效:
这不会:
xgb.setinfo(dmat, names(p), p[[1]]) 中的错误:标签的长度必须等于输入数据中的行数
r - xgboost 使用 R xgb.importance 抛出错误
我第一次使用来自 CRAN 的 xgboost 包。
创建模型为:
当我打电话时,xgb.importance
我得到一个错误:
Error in readLines(filename_dump) : 'con' is not a connection
任何想法为什么?
r - 为什么 xgboost 不绘制我的树?
我正在运行 xgboost 模型,如下所示:
变量重要性矩阵绘制得很好但是当我跟随
RStudio 打开一个新的浏览器窗口并显示大量 HTML,但没有图像。HTML 包含所有细节,例如创建图形所需的脚本等,但我没有这些 java 脚本,我认为它应该像绘制重要性矩阵一样工作。
我错过了什么?
xgboost - 梯度提升过程 (xgboost) 中如何使用参数“权重”(DMatrix)?
在 xgboost 中,可以weight
为 a设置参数DMatrix
。这显然是一个权重列表,其中每个值都是相应样本的权重。我找不到有关这些权重如何在梯度提升过程中实际使用的任何信息。它们有关系eta
吗?
例如,如果我将weight
所有样本设置为 0.3 并eta
设置为 1,这是否与设置eta
为 0.3 和weight
1 相同?
python - 从 shell 运行时发现 Python 模块,但不是从 IPython
我在 Windows 7 上安装了 Anaconda python,然后使用此处的说明手动安装了 xgboost 包:如何在 python (windows 平台) 中安装 xgboost 包?(它没有安装在 anaconda 下,而是安装在单独的目录中)
我将以下内容放在 test.py 中:
当从命令行(例如,从 cygwin)导入时,导入工作正常。但是,如果我使用 Anaconda 附带的 Spyder IDE 或 IPython,我会得到
我检查了 sys.executable,并且在 shell 和 IPython 中运行相同的 python。打印 sys.path 表明在这两种情况下,正确的位置都是路径的一部分。知道发生了什么吗?我真的很想能够使用 IDE。
python - XGBOOST Java API
我正在尝试使用 XGBOOST 库对销售进行一些预测。但我使用的是 Java API,因为我比 Python 更熟悉 Java。我们还试图验证的另一件事是,在使用相同数据集训练模型时,使用 Python 与 Java 是否会有任何与性能相关的收益。
但问题是我很难找到Pandas、SciKit等的 Python 等效库。所以我使用以下库来构建 DataFrame,然后对它们进行一些操作。然后将其转储到 CSV 文件中,并再次使用另一个库来读取数据并执行训练和验证数据集的 80/20 拆分。我再次将输出转储到 CSV 文件中,然后将数据读回 XGBOOST 库以创建 DMatrix。
图书馆:
- 数据框的细木工
- Weka 用于将数据拆分为 80/20 拆分
- 用于建模的官方 XGBOOST JVM 包
我知道这不是在 Java 中执行此分析的有效或正确方法。但与此同时,我没有看到任何使用 Java 或 Java 中的任何库完成所有这些操作的示例。
我想检查是否有人使用库的 Java 实现对数据进行了 XGBOOST 分析。此外,如果您在将数据拆分为训练和测试数据集之前使用了任何包来创建 DataFrame、执行操作等。
他将不胜感激任何帮助。
xcode - Install xgboost on Mac - ld: library not found
I am trying to install OpenMP enabled xgboost on my mac. I installed gcc
with no problem:
then cloned git repository:
but I get an error when I do
Here is the error I get. I'd appreciate if you can help fixing this problem:
c++ - 在 Mac 上安装 xgboost 失败 - ar:未指定存档成员
我正在尝试在 Mac 上安装 xgboost。我按照github上的说明进行操作,但是运行时make -j4
出现错误:
如果我只运行make
(不运行-j4
),我会得到:
知道是什么原因造成的,我该如何解决?
虽然我可能错了,但我认为是因为ar
mac 上的存档实用程序太旧了(从 2005 年开始):
任何想法如何ar
在 OS X 上更新到最新版本?
这是供您参考的makefile:
非常感谢。
python - Mac上的Xgboost包
我正在尝试使用 Xgboost,但在安装时遇到问题。我正在使用mac,我也使用python notebook jupyter。我打开命令行并使用pip install xgboost
它并成功安装,但是当我尝试通过编写在我的代码中使用它时,import xgboost as xg
我得到 ImportError: No module named xgboost
有人可以帮助我吗?