问题标签 [variable-selection]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
93 浏览

r-package - R中cox回归的变量选择

我希望一切都好。我正在尝试使用机器学习方法为 cox 比例风险回归分析进行变量选择。

我发现了这篇不错的论文:Cox Proportional Hazards Models via Approximated Information Criteria 的 Sparse Estimation of Cox Proportional Hazards Models

论文名称:coxphMIC: An R Package for Sparse Estimation of Cox Proportional Hazards Models via Approximated Information Criteria 链接:https ://www.semanticscholar.org/paper/coxphMIC%3A-An-R-Package-for-Sparse-Estimation -of-Cox-Nabi-Su/684bba7a8cb7afacaa7203249cfc06180a5d522f

我想知道我是否使用 CoxphMIC 命令在 R 上运行了稀疏估计,它为最终模型选择了变量。

我有几个问题: - 我可以为 coxphMIC 做哪些估计后测试?- 我可以使用 coxphMIC 选择的变量并单独使用它们来运行 cox 比例风险回归模型吗?- 我可以使用这些变量来运行贝叶斯 cox 比例风险模型吗?,即使 coxphMIC 为 cox 危险回归选择变量?这是否合理?

非常感谢您的帮助

期待您的回音

0 投票
0 回答
34 浏览

r - 使用 miselect 包在测试和训练数据集中 MI 后拆分堆叠数据集用于 MI Lasso / Elastic Net

我是 R 新手,需要进行 MI Lasso/Elastic Net Regression。对于 MI,我使用“mice”包。我需要堆叠格式的 MI 数据来使用包“miselect”执行 ML 模型。我在 MI 之后得到堆叠的数据集,如下所示:

imputed_long <- complete(imputed, include=F, "long")

为了能够看到我的模型与数据的匹配程度,我需要将数据集拆分为测试和训练数据集。

我有两个问题:

  1. 在 MI 之前拆分数据是否更好;之后对测试和训练数据集以及 ML 模型分别进行 MI 吗?或者我应该在执行 MI 后拆分数据集吗?我如何将堆叠的数据集拆分为训练和测试数据集(80/20 会很棒)?
  2. 如何在“错误选择”中获得 ML 模型的预测性能?我在 miselect 包描述中找不到任何示例。我可以用我的代码交叉验证 alpha 和 lambda,但不知道如何继续。
0 投票
1 回答
133 浏览

python - 如何在 Python 中为这个线性规划问题建模?

我的任务是使用 Python 对 Dantzig Selector 进行编程,但我没有得到任何指导,也没有太多线性编程或数据科学方面的经验。我在 LP 模块手册或本网站的其他问题中找不到我需要的信息。

这就是问题。我正在寻找列向量^β。抱歉,我的程序的这一部分没有任何代码,因为我不知道如何解决这个问题。我尝试了几种方法,但都没有正确反映问题,所以我拒绝并删除了它们。

min||^β||l1 st ||xT(y-x^β(||l(inf) <= δ

它可以重写为线性程序。

^β 是一个 kx1 列向量和我正在寻找的 Dantzig 选择器。

  • y 是观察/响应的 nx1 列向量
  • X 是一个 nxk 样本矩阵,其中 k >> n
  • δ 是噪声变量

这里有更多可能有用的细节。

到目前为止,这是我的工作代码。数据值都只是样本/占位符。我已经准备好了 X、y 和一些 δ 值。但是,我找不到合适的 LP 函数来给我 ^β。

这是我在这个网站上的第一篇文章。与其他人相比,我对帖子中缺乏细节表示歉意。

0 投票
0 回答
17 浏览

sass - Visual Studio 2019 - 双击选择 scss 变量不再选择美元符号

我已经搜索了很多关于如何做到这一点的不同变体,但找不到任何东西!请帮忙。

在 Visual Studio 2019 中,我曾经能够双击一个 scss 变量(在*.scss文件内),它会突出显示整个变量。但现在它只是突出显示这个词,而不包括美元符号(见图)。

当前的 scss 变量选择不起作用

例如,我可以编辑 Notepad++ 并更改分隔符以删除美元符号,以便它在那里工作,但找不到适用于 Visual Studio 2019 的分隔符。我认为这是我最近所做的更新。我也一直在尝试找到为其他人更改此设置的设置,但找不到任何东西。

要清楚,我需要的是,当我双击这个变量时,它也会像这样选择美元符号: 正确的 scss 变量选择

0 投票
0 回答
12 浏览

python - 如何选择相关变量以对非常大的数据集应用逻辑回归

我有一个与 Kaggle 竞赛数据集相关的项目,该数据集出现在 application_train csv https://drive.google.com/drive/folders/1zYotRg3l_m66JQRrGYi1VkuW0A0tfC4K?usp=sharing

目标是进行逻辑回归。但是,我在数据选择方面遇到了麻烦。

由于我有 122 个变量,我将如何选择最相关的变量?

data = pd.read_csv("C:/Users/migue/Downloads/application_train.csv") Data_head

谢谢

0 投票
2 回答
75 浏览

r - 从 glmnet 获取变量选择顺序

我一直在使用 glmnet R 包为一个目标变量 Y(数字)和 762 个协变量构建 LASSO 回归模型。我使用 glmnet() 函数,然后coef(fit, s = 0.056360)获取特定 lambda 值的系数值。

我现在需要的是变量选择顺序,即先选择哪个协变量(首先进入模型),第二个,第三个等等。

使用plot(fit, label = TRUE)时,理论上我可以通过绘制的路径看到顺序,但是,协变量太多,标签难以辨认。

您可以从图像中看到,第一个协变量是 267(绿色路径),然后是 12,但其余的都难以辨认。

协变量路径

0 投票
0 回答
23 浏览

machine-learning - 选择重要特征来执行随机森林分类

我有 9 个参数,我想选择 6 个重要参数并丢弃 3 个。最好的方法是什么?我已经看到了一些通过递归特征消除(例如RFECV)对参数进行排名的方法。我可以使用随机森林分类对参数进行排序并选择那些重要的参数并将它们用于随机森林分类器吗?我的问题是,在使用随机森林算法进行特征选择时,如何确保我使用了最好的超参数。使用非超调随机森林分类器并决定参数的重要性是否正确?还有其他选择重要特征的方法吗?