问题标签 [rweka]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 解析决策树(来自 WEKA 分类器)以在 R 中绘图?
我想绘制一个 ID3 模型的结果。它似乎在 WEKA 和 R 中都没有默认的绘图模块。
是否有已经制作的代码来执行此操作?(或者,下面的树格式是否有一个标准名称,我可以很容易地找到一个解析器?)
这是一些基本代码:
结果如下:
树形结构很容易理解。关于如何解析这个有什么建议吗?(也许类似于这里的答案?)
谢谢。
r - RWeka IBk (KNN) CV 评估输出缺失
我有一个数据集 Auto,其类标签称为 mpg01,它是一个二进制变量。我正在使用以下代码来训练和交叉验证模型:
然而,总结只给了我:
它不会打印出正确分类的实例或错误分类的实例。我想知道可能是什么原因。
所有属性和类标签都是 num 类型。是因为我没有将类标签(mpg01)转换为因子类型吗?提前致谢。
java - Java 应用程序未在 OS X Yosemite 上运行
安装 OS X Yosemite 后,我的一个 Java 应用程序停止运行。消息是我需要 JAVA SE 6 Runtime。就像在Eclipse Kepler 中为 OS X Mavericks 请求 Java SE 6
我按照用户 Nikolas 的建议做了,显然与用户 Sage 评论的问题相同:
最初,这给了我 Eclipse 错误Failed to create the Java Virtual Machine
,但那是因为我/usr/bin/java
的符号链接到另一个 1.7(/Library/Internet/... 插件一个而不是 /Library/Java... 一个)。修复该链接后,这对我来说非常有用 - 我希望我能投两票!– sage 2013 年 12 月 28 日 0:43
这是终端在尝试运行后所说的:
任何人都可以建议我如何解决这个问题?
r - 保存/加载 M5 RWeka 插入符号模型失败
通过 Caret 加载 RWeka 包的已保存 M5 实现后,我遇到了一个错误。
.jcall(o, "Ljava/lang/Class;", "getClass") 中的错误:
RcallMethod:尝试调用一个NULL对象的方法。
要重现错误:
这篇文章表明 RWeka 对象是对 Java 对象的引用,并且该对象必须被序列化才能正确保存/加载。
但是,我找不到将其扩展到 Caret 包实现的正确命令。
r - R 和 tm 包:用一个或两个单词的字典创建一个术语文档矩阵?
目的: 我想使用具有复合词或bigrams作为一些关键字的字典创建一个术语文档矩阵。
网络搜索: 作为文本挖掘和 中的tm
包的新手R
,我上网了解如何做到这一点。以下是我找到的一些相关链接:
背景: 其中,我更喜欢NGramTokenizer
在RWeka
包中使用的解决方案R
,但我遇到了一个问题。在下面的示例代码中,我创建了三个文档并将它们放在一个corpus中。请注意,Docs 1
and2
每个都包含两个单词。 Doc 3
只包含一个词。我的字典关键字是两个二元组和一个一元组。
问题:上述链接中的NGramTokenizer
解决方案没有正确计算Doc 3
.
我期待着为其他两个Doc 3
人付出代价。我有什么误解吗?1
jedi
0
algorithm - RWeka 的规则学习算法,查找有关日期的规则的问题
我对 R 的 RWeka 包有一些问题,更准确地说是规则学习算法。我自己创建了一个 .arff 文件,您可以在下面看到。现在我已经用 .arff 文件的数据运行了 RWeka 包的 JRip 和 J48 算法,得到了以下规则:
所以现在我的问题是为什么算法找不到基于生产日期的规则?原因很明显,2013-04-01生产的所有产品都有缺陷。
我的错误是什么?
提前致谢!提多24
r - 基于修剪规则的分类树(PART算法)
我在 R 中使用 PART 算法(通过包 RWeka)进行多类分类。目标属性是客户支付发票的时间段(如 7-15 天、15-30 天等)。我正在使用以下代码来拟合和预测模型:
通过使用这个模型,我在训练数据上获得了大约 82% 的准确率。但测试数据的准确率约为 59%。我知道我过度拟合了模型。我试图减少预测变量的数量(上面代码中的预测变量是减少的变量),但这并没有多大帮助。减少变量的数量将测试数据的准确度提高到 61% 左右,并将训练数据的准确度降低到大约79%。
由于 PART 算法基于部分决策树,因此另一种选择是修剪树。但我不知道如何为 PART 算法修剪树。在互联网搜索中,我发现 FOIL 标准可用于基于规则的修剪算法。但我无法在 R 或 RWeka 中找到 FOIL 标准的实现。
我的问题是如何为 PART 算法修剪树,或者任何其他提高测试数据准确性的建议也是受欢迎的。
提前致谢!!
注意:我将准确率计算为正确分类的实例数除以实例总数。
r - model.frame.default(formula = class ~ ., data = rtrain) 中的 Rweka 错误:对象不是矩阵
我是使用Rweka
and的新手R
。当我KNN
用来训练数据时,比如编写以下代码。
这是错误日志:
而且我还测试了train data
. 这里是:
r - r 中 RWeka 包中逻辑模型树 (LMT) 结果的图框的解释是什么?
我正在研究具有 5 个已知组的用户分类(观察结果大致均等地分布在组中)。我有关于这些用户的信息(比如年龄、居住区域......),并尝试找到识别每个组中用户的特征。
为此,我使用 R 中的 Rweka 包(机器学习算法集合:http ://cran.r-project.org/web/packages/RWeka/RWeka.pdf )。为了找到区分我的组的特征,我使用逻辑模型树 (LMT)。关于这个函数的信息很少:
- 我将尝试绘制一个绘制树的示例。拆分很容易解释,但在每个终端节点中都有一个填充有:
LM_24:48/96
(20742)
这是什么意思?如何查看节点在五个组中的哪一个结束?
- 使用什么函数可以检索模型中使用的系数?这样就可以研究变量的影响。
(我确实研究了在这些数据上构建树的其他方法,但回归和分类树包(如 rpart、party)都只在我的数据中找到一个终端注释,而 LMT 函数找到 6 个拆分节点)
我希望你能为我提供这个功能的答案/一些帮助。非常感谢!
r - 为向量的所有元素调用函数
嗨,我正在尝试使用几个单独的模型和几个单独的种子来执行线性回归。
目前我有以下工作但看起来不太像 R
那么是否有更多类似 R 的方法可以做到这一点,如果没有,有没有人知道如何通过循环不同的模型来完成我在这里尝试做的事情?
编辑:我认为这个迭代模型部分并相应地更新了帖子。这仍然留下一个问题,是否有比 foreach 更好的方法来做到这一点(这似乎不太像)