问题标签 [driverless-ai]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
driverless-ai - 在 AWS 上安装无人驾驶 AI
我已按照以下说明在 AWS 实例上安装了 DAI 社区应用程序:
http://docs.h2o.ai/driverless-ai/latest-stable/docs/userguide/install/aws.html
https://localhost:12345给了我登录屏幕。标准凭据“h2oai”和“h2oai”返回“无效的用户 ID 或密码”。什么是凭证?
此外,DAI 安装到 /opt。我在任何地方都看不到 /data 和 /license 文件夹。他们在哪里?
driverless-ai - 可以产生贡献的模型
我收到一个错误:
是什么产生了这个错误?哪些模型不支持 pred_contribs=True?
machine-learning - 如何将数字列更改为无人驾驶 AI 上的分类数据
我尝试使用 docker 版本使用 Driverless AI。当我尝试导入我的数据时,我在识别哪些数据是实数和分类变量时遇到了问题。
如何解决这个问题?
h2o - DAI 是否在训练期间进行标准化/规范化,它尝试了哪些方法,以及遗传算法是否都尝试了它们?
通常我不确定在使用 DAI 时对数据进行何种程度的预处理。通常,您希望为生产级模型降低维度、消除重复特征、标准化/规范化等。是否有一条规则,我应该停止个人预处理以支持 DAI(IE 只去除 Nan 的二进制分类算法,其余的由 DAI 完成)。它会明确解释它使用了哪种标准化技术,例如来自 Sklearn 的 MinMaxScaler() 吗?
split - How to download "Split" CSV files from H2O DAI?
I notice the new function of "Split" in the "Dataset" menu, which is quite wonderful.
How can we download the newly generated CSV files from this "Split" function ?
I tried 'find' in the server directories, but I see that the split csv files are stored in the server NOT in plain texts.
/opt/dai-1.5.4-linux-ppc64le/tmp# find . -name atec_anti_fraud_test1* ./fuhilapa/atec_anti_fraud_test1.1557095335.9342732.bin
/opt/dai-1.5.4-linux-ppc64le/tmp# file ./fuhilapa/atec_anti_fraud_test1.1557095335.9342732.bin ./fuhilapa/atec_anti_fraud_test1.1557095335.9342732.bin: data
/opt/dai-1.5.4-linux-ppc64le/tmp# head -n 2 ./fuhilapa/atec_anti_fraud_test1.1557095335.9342732.bin JAY1@▒▒@▒▒@▒▒@▒▒@▒▒@▒▒@▒▒@▒▒ @ ▒ ▒ @
python - DAI 如何在生产环境中处理新的(训练中看不到的)分类值?
我想确认 DAI 遵循类似的结构来处理它在训练中没有遇到的分类变量,就像在这个答案中一样h2o DRF unseen categorical values handling。我无法在 H2O Driverless AI 文档中明确找到它。
还请说明该链接的某些部分是否已过时(如答案中所述)以及如果情况不同,将如何处理它。请注意 h2o DAI 的版本。谢谢!
python - 在 DAI 中部署期间,用于对新预测进行评分的最终阈值是什么/在哪里?
我有一个二进制分类问题,通过 DAI 运行它,并得到测试 AUC。在哪里可以找到部署期间用于对新数据行进行评分的概率阈值?
一个例子是 0.50 的阈值;IE 目标变量 >.50 得到 1,而 target<.50 在决策期间得到 0(反之亦然)。当您在 AUC 曲线上移动时,我需要超出 GUI 中显示的 4 位连接数字的确切阈值。在下面的图片中,我已经匹配了阈值,并且无法获得具有相同阈值的相同混淆矩阵。请注意,误报的差异非常小。
更新答案:在 DAI 上完成实验后下载“实验摘要”选项卡。在 zip 文件中,您会找到一个ensemble_roc_test.json,它提供了最多 10 位的阈值。
python - mojo-pipeline 是否会自动删除训练期间指定的列?
我进行了 DAI 实验并构建了 mojo 管道。现在我有了全新的数据,其中包含我最初在 DAI GUI 中放置的列;以 ID 列为例。mojo-pipeline 是否会在评分时自动删除这些列,还是我需要事先这样做?