问题标签 [iml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
168291 浏览

android-studio - Android Studio 中的 .iml 文件是什么?

.imlAndroid Studio 项目中有哪些文件?我读到它是模块的配置文件。我不明白它是如何工作的,我不能只使用 gradle 脚本与您添加到项目中的外部模块集成。

此外,大多数时候 AS 会生成它们,因此我无法控制项目行为。如果我有一个在 Eclipse 和 AS 等不同 IDE 中工作的团队,是否可以设置我的项目使其与 IDE 无关?

我不完全理解这个系统是如何工作的。

0 投票
0 回答
71 浏览

r - R 中 IML 包中神经网络变量重要性的缺失值

我尝试从 R 中带有 iml 包的神经网络中获取变量的重要性。因变量是二进制的,并且预测变量是标准化的。我得到每个预测变量的缺失值。这是我正在使用的代码:

除了缺失值(即所有预测变量)不合适的事实外,我没有收到任何消息。

0 投票
1 回答
900 浏览

r - R中的错误Predictor.new()函数包IML

我正在尝试在 R 中使用包“iml”从 H2O 中创建的 GBM 模型创建 SHAP 值图。

当我尝试使用该Predictor.new()函数创建 R6 Predictor 对象时,我收到一条错误消息,指出Error : all(feature.class %in% names(feature.types)) is not TRUE.

据此,我猜测其中一个要素类存在一些不正确的地方,但这只是基于错误消息字面意思的有根据的猜测。

这是一个匿名数据的样本(我不能分享真实数据,因为它是机密的):

这里也是我在上面的代码中使用的数据集和模型对象的基本描述:

如果还有什么我可以提供的,或者我不清楚,请告诉我。

0 投票
2 回答
533 浏览

r - 如何让 R IML FeatureImp() 函数工作?

我试图让 IML 包中的 FeatureImp 函数工作,但它一直抛出错误。下面是一个来自 diamonds 数据集的示例,我在该数据集中训练了一个随机森林模型。

这以以下错误结束:

我不明白我做错了什么。谁能给我线索?

我正在研究 R 版本 3.5.1,iml 包版本 0.9.0。

0 投票
1 回答
1620 浏览

r - 没有适用于“预测”的方法应用于 R 中的 iml::Predictor 类“c('ksvm','vm')”的对象

我在 R 中有以下代码段,我尝试在其中训练基于 SVM 的模型:

但是,预测器会抛出标题上显示的错误。任何想法为什么会发生这种情况以及如何克服它?

0 投票
1 回答
330 浏览

r - R,毫升,毫升。特征重要性总是为每个特征返回 1

我正在使用 mlr 框架做一些事情,导致FeatureImp每个功能都返回 1,但我无法将手指放在它上面。这是一个例子:

reprex 包(v0.3.0)于 2020 年 1 月 23 日创建

0 投票
0 回答
107 浏览

r - “iml”2D 累积局部效应 (ALE) 图

我想使用 R 包iml制作一个 2D 累积局部效应(ALE)图

图 5.20:湿度和温度对预测租用自行车数量的二阶影响的 ALE 图。)

即使我阅读了iml手册我也不确定,谁能告诉我如何编写代码?

作为参考,一维 ALE 如下。

0 投票
1 回答
96 浏览

r - 并行运行 iml 包会导致 R 中的挂钟时间变慢?

因此,我正在关注有关在此处iml找到的并行运行计算的小插图中的示例。但是,我有几个我不理解的问题。

首先,在示例中,他同时调用future库和future.callr库,然后创建一个具有 2 个内核的 PSOCK 集群,如下所示:

但是,这对我来说根本不起作用......如果我使用plan("callr", workers = 2)then,当我尝试进行任何计算时,它只会永远挂起,直到我终止进程。

相反,我正在使用plan(cluster),这至少似乎完成了计算。但是,如果我继续按照小插图中的示例来计算交互强度,则处理时间确实要快得多……但是现在挂钟时间要慢得多。下面的代码概述了这一点:

因此,如上所示,处理时间要快得多。但实时速度明显变慢,这似乎有点违背并行计算的目的!?当您增加变量/观察值的数量时,这个问题似乎变得更加普遍。当我使用具有 10 个变量和 300 个观察值的数据集时,没有并行的实时时间 = ~30s,并行时间 = ~50s。

我的问题是,这里发生了什么?我是否遗漏了一些关于并行计算的基本概念,还是我实施错误?为什么在进行并行计算时挂钟(实时)时间会慢得多?

cores[奖金问题]和有什么区别workers?该future包有 2 个名为availableCoresand的函数availableWorkers,但我不确定有什么区别?

0 投票
0 回答
72 浏览

r - 使用 logLoss 作为评分函数的排列重要性(iml 包)

我想使用iml -package计算排列特征重要性并使用 logLoss 作为损失函数。

不幸的是,我在最后一步收到错误消息“Math.factor 错误(预测):'log' 对因子没有意义”。

有人知道我犯了什么错误吗?先感谢您。

0 投票
1 回答
58 浏览

r - 有没有办法限制 IML 包 Shapley 值中的特征数量?

我有一个使用 H2O 包创建的 automl 模型。目前,H2O 仅在基于树的模型上计算 Shapley 值。我使用 IML 包来计算 AML 模型上的值。不过,因为我有大量的特征,所以剧情太杂乱而无法阅读。我正在寻找一种仅选择/显示前 X 个功能的方法。我在 IML CRAN PDF 和谷歌搜索找到的其他文档中都找不到任何内容。

任何建议/帮助表示赞赏。

谢谢你,布赖恩