问题标签 [e1071]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

26 问题

0 投票

1 回答

493 浏览

r - countpattern：无效的“nrow”值（太大或 NA）

我在应用 e1071 包中的 countpattern 函数时遇到了困难。我的目标是找到二进制模式并计算它们。我的数据由一个包含 114 列和 9800 行的大矩阵（1117200 个元素，9.6 MB）组成。应用该功能时，我不断收到以下错误消息：

矩阵中的错误（0、2^nvar、nvar）：无效的“nrow”值（太大或 NA）

我正在测试该函数，逐渐增加我的数据中的列数，并且它一直有效，直到使用约 19 列（只是我总共 114 列的一小部分）。不仅如此，它还产生了一个错误。

因此，解决方案可能是找到比此函数更有效的函数/算法来查找二进制模式。但是，在继续之前，我想问一下是否有办法使用 countpattern 函数来勾勒这种情况？

谢谢你的时间！

根据@slamballais 的要求，数据样本如下所示，

data_sample <- rbind(c(1,1,1,0,1,0,1,1,0,1,0), c(1,0,0,1,1,1,9,1,0,0,1), c(1,0,0,0,0,1,0,1,1,0,0), c(0,1,1,0,0,0,0,0,1,1,1), c(1,1,1,0,0,1,1,0,1,1,0))

r e1071

0 投票

1 回答

92 浏览

r - R中的e1071包中的峰度计算是否需要3个以上的值？

使用 e1071 包计算峰度时，如下所示：

无论我选择什么 3 个数字，我总是得到 -2.33。对于 2 个数字，它始终为 -2.75。但是，当使用其他方法（例如 python 中的 pandas）时，我会为我选择的每组值得到不同的峰度。

这是包中的错误还是我使用此包错误？谢谢！

r statistics kurtosis e1071

0 投票

0 回答

42 浏览

r - 是否可以并行使用 e1071 调整随机森林？

我正在寻找一些关于如何并行化以下代码的提示。是否可以并行运行 e1071？如果没有，您能否建议任何其他软件包/我如何更改下面的代码以并行运行。

r doparallel e1071

0 投票

0 回答

37 浏览

r - 如何快速估计 SVM 的 gamma 和成本参数

我想在 R 中训练 SVM，我知道有一些函数e1071::tune.svm()可以用来找到 SVM 的最佳参数。但是，似乎有一些公式（例如在本报告中使用）可以为您提供对这些参数的合理估计。由于在较大的数据集上对参数进行网格搜索可能会花费大量时间，而且通常，无论如何都必须提供一系列可能的值，我想知道是否有一个包可以实现公式来快速估计gamma和cost支持向量机的参数？

到目前为止，我发现caret::train()可能会使用这种方法来估计sigma（应该是 2* gamma^2 的倒数）但我还没有尝试过，因为其他计算仍在运行（并且可能会接下来的几天）。是否还有一种实现来估计cost或至少给出一个合理值的范围？

我发现了一个类似的问题，通常要求寻找网格搜索的替代方案。但是，我会对此类替代方案的 R 实现感兴趣，而且我希望自从几年前发布更一般的问题以来，事情会进一步发展。

r svm caret e1071

0 投票

1 回答

32 浏览

r - SVM 性能与 AUC 分数不一致

我有一个包含患者信息的数据集。它包括几个变量及其临床状态（如果他们健康，则为 0，如果他们生病，则为 1）。我试图实现一个 SVM 模型来根据这些变量预测患者状态。

为了测试模型的性能，我计算了 ROC AUC，并使用验证集获得了 AUC = 0.997。但是当我查看预测时，所有患者都被指定为健康。

谁能帮我解决这个问题？

r svm prediction auc e1071

0 投票

0 回答

5 浏览

dataframe - xj[i] 中的错误：只有 0 可能与尝试为 SVM 创建数据帧的负下标混合

我通过运行带有“e1071”包的 SVM 遇到了一些问题。我有 2 个矩阵：“火车”包含每日回报

return_sig 是一个矩阵，如果今天的回报大于昨天的回报，则给出“+1”，如果相反，则给出“-1”

这给了我错误：

xj[i] 中的错误：只有 0 可能与负下标混合

我希望我以正确的方式设置模型，但如果我不解决这个问题，我也无法进行plot()测试predict()。我的另一个问题是：如果我合并数据框中的 2 矩阵，我会得到一个包含 15000 条记录（300x50）的 df。我应该使用这个长的 1 列 df 还是应该使用正确的列数设置 df？

dataframe machine-learning svm e1071

1 2 3 4 5 6 7 8 9 10

问题标签 [e1071]

r - countpattern：无效的“nrow”值（太大或 NA）

r - R中的e1071包中的峰度计算是否需要3个以上的值？

r - 是否可以并行使用 e1071 调整随机森林？

r - 如何快速估计 SVM 的 gamma 和成本参数

r - SVM 性能与 AUC 分数不一致

dataframe - xj[i] 中的错误：只有 0 可能与尝试为 SVM 创建数据帧的负下标混合

Reference