问题标签 [e1071]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
493 浏览

r - countpattern:无效的“nrow”值(太大或 NA)

我在应用 e1071 包中的 countpattern 函数时遇到了困难。我的目标是找到二进制模式并计算它们。我的数据由一个包含 114 列和 9800 行的大矩阵(1117200 个元素,9.6 MB)组成。应用该功能时,我不断收到以下错误消息:

矩阵中的错误(0、2^nvar、nvar):无效的“nrow”值(太大或 NA)

我正在测试该函数,逐渐增加我的数据中的列数,并且它一直有效,直到使用约 19 列(只是我总共 114 列的一小部分)。不仅如此,它还产生了一个错误。

因此,解决方案可能是找到比此函数更有效的函数/算法来查找二进制模式。但是,在继续之前,我想问一下是否有办法使用 countpattern 函数来勾勒这种情况?

谢谢你的时间!

根据@slamballais 的要求,数据样本如下所示,

data_sample <- rbind(c(1,1,1,0,1,0,1,1,0,1,0), c(1,0,0,1,1,1,9,1,0,0,1), c(1,0,0,0,0,1,0,1,1,0,0), c(0,1,1,0,0,0,0,0,1,1,1), c(1,1,1,0,0,1,1,0,1,1,0))

0 投票
1 回答
92 浏览

r - R中的e1071包中的峰度计算是否需要3个以上的值?

使用 e1071 包计算峰度时,如下所示:

无论我选择什么 3 个数字,我总是得到 -2.33。对于 2 个数字,它始终为 -2.75。但是,当使用其他方法(例如 python 中的 pandas)时,我会为我选择的每组值得到不同的峰度。

这是包中的错误还是我使用此包错误?谢谢!

0 投票
0 回答
42 浏览

r - 是否可以并行使用 e1071 调整随机森林?

我正在寻找一些关于如何并行化以下代码的提示。是否可以并行运行 e1071?如果没有,您能否建议任何其他软件包/我如何更改下面的代码以并行运行。

0 投票
0 回答
37 浏览

r - 如何快速估计 SVM 的 gamma 和成本参数

我想在 R 中训练 SVM,我知道有一些函数e1071::tune.svm()可以用来找到 SVM 的最佳参数。但是,似乎有一些公式(例如在本报告中使用)可以为您提供对这些参数的合理估计。由于在较大的数据集上对参数进行网格搜索可能会花费大量时间,而且通常,无论如何都必须提供一系列可能的值,我想知道是否有一个包可以实现公式来快速估计gammacost支持向量机的参数?

到目前为止,我发现caret::train()可能会使用这种方法来估计sigma(应该是 2* gamma^2 的倒数)但我还没有尝试过,因为其他计算仍在运行(并且可能会接下来的几天)。是否还有一种实现来估计cost或至少给出一个合理值的范围?

我发现了一个类似的问题,通常要求寻找网格搜索的替代方案。但是,我会对此类替代方案的 R 实现感兴趣,而且我希望自从几年前发布更一般的问题以来,事情会进一步发展。

0 投票
1 回答
32 浏览

r - SVM 性能与 AUC 分数不一致

我有一个包含患者信息的数据集。它包括几个变量及其临床状态(如果他们健康,则为 0,如果他们生病,则为 1)。我试图实现一个 SVM 模型来根据这些变量预测患者状态。

为了测试模型的性能,我计算了 ROC AUC,并使用验证集获得了 AUC = 0.997。但是当我查看预测时,所有患者都被指定为健康。

谁能帮我解决这个问题?

0 投票
0 回答
5 浏览

dataframe - xj[i] 中的错误:只有 0 可能与尝试为 SVM 创建数据帧的负下标混合

我通过运行带有“e1071”包的 SVM 遇到了一些问题。我有 2 个矩阵:“火车”包含每日回报

return_sig 是一个矩阵,如果今天的回报大于昨天的回报,则给出“+1”,如果相反,则给出“-1”

这给了我错误:

xj[i] 中的错误:只有 0 可能与负下标混合

我希望我以正确的方式设置模型,但如果我不解决这个问题,我也无法进行plot()测试predict()。我的另一个问题是:如果我合并数据框中的 2 矩阵,我会得到一个包含 15000 条记录(300x50)的 df。我应该使用这个长的 1 列 df 还是应该使用正确的列数设置 df?