问题标签 [rweka]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2267 浏览

r - Knitr 提供与 RStudio 不同的结果

我正在使用 Knitr 使用“tm”和“RWeka”进行一些初始文本挖掘,以实现可重复性。

我正在尝试获取基于两个文本文件的语料库的术语文档矩阵,当我在 RStudio 中运行代码以及将其编入 HTML 文件时,该过程会产生不同的结果:HTML 文件

...当我尝试其他文档输出 PDF 和 Word 输出时:PDF 和 Word 输出

同意 RStudio。

而且,我需要一个 HTML 输出....

知道会发生什么吗?

这是.Rmd代码

```

sessionInfo() R 版本 3.2.3 (2015-12-10) 平台:x86_64-apple-darwin13.4.0 (64-bit) 运行于:OS X 10.11.4 (El Capitan)

语言环境:[3] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8

附加的基础包:[3] stats graphics grDevices utils datasets methods base

其他附加包:[3] R.utils_2.2.0 R.oo_1.20.0 R.methodsS3_1.7.1 dplyr_0.4.3 xtable_1.8-0
[6] pander_0.6.0 RWeka_0.4-24 SnowballC_0.5.1 tm_0.6-2 NLP_0 .1-9
[11] knitr_1.12.3

0 投票
1 回答
393 浏览

java - 无法在 Mac OS X El Capitan 上的 R 中使用 FSelector 包

我现在使用的是 OS X El Capitan 版本 10.11.3。

当我尝试library(FSelector)在 R 中使用时,会弹出错误消息:

此外,当我尝试library(Rweka)library(Rwekajars).

为什么会发生这种情况以及如何解决?

0 投票
0 回答
71 浏览

r - J48并联运行

我收到以下错误:

我想创建并行模型(J48)。这样将为每个子数据集建立一个模型。例如,对于iris_dataset[[1]]J48 将是j48_c.models[[1]]... 而对于iris_dataset[[18]]J48 将是j48_c.models[[18]].

您可以通过以下方式单独运行模型:

0 投票
1 回答
449 浏览

r - 在 R 中将关键术语(语料库)搜索到另一个

我之前问过这个问题并得到了负面反馈,因为我没有提供代码。我花了一整天的时间尝试和尝试,现在我陷入了一个问题。

此代码已由 Stackoverflow 中的用户“Tyler Rincker”<-非常感谢他!

这是代码:

我的问题是我想在语料库中搜索二元组或三元组(2 或 3 个单词)。

当我执行这行代码时:

我得到的结果应该显示频率为“1”。

但是,如果关键字只有 1 个单词:

代码工作正常,我得到以下结果:

非常感谢!并希望有人可以提供帮助。

0 投票
2 回答
2194 浏览

java - RWeka 在 OSX 10.10.5 下抛出 java.lang.UnsupportedClassVersionError

当我尝试创建分类器时,在 OS 10.5.5 下使用 RWeka 0.4-28 收到以下错误消息:

.jnew("weka/core/Attribute", attname[i], .jcast(levels, "java/util/List")) 中的错误:java.lang.UnsupportedClassVersionError: weka/core/Attribute:不支持的major.minor 版本51.0

我已经签入终端并且我的 Java 是最新的

这是 RWeka 中的错误还是我的配置中的错误?

0 投票
1 回答
332 浏览

r - RWeka 不能与插入符号或可能的 %dopar% 一起使用

我正在完成caret作者的应用预测建模(该软件包的 R 教科书)中的练习。我无法train使用方法M5PM5Rules.

代码将手动运行良好:

相同的数据和控件(将“规则”替换为“M” -为什么我不能将 M 指定为调整参数?)将无法完成:

书中的示例也不会完成:

至少对我来说,这可能是与 RWeka 一起使用并行后端的问题。我上面的例子不会以%dopar%.

sudo R CMD javareconf在每个示例之前运行并重新启动了 Rstudio。

0 投票
1 回答
178 浏览

r - 如何在 RWeka 中实现备份标记器开关?

我正在使用 R-tm-Rweka 包进行一些文本挖掘。我必须提取 ngram,而不是在单个单词上构建 tf-tdm,这对我的目的来说还不够。我使用@Ben函数TrigramTokenizer <- function(x) NGramTokenizer(x, Weka_control(min = 2, max = 3)) tdm <- TermDocumentMatrix(a, control = list(tokenize = TrigramTokenizer))
来提取三元组。输出有一个明显的错误,见下文。它会选择 4 个、3 个和 2 个单词的短语。理想情况下,它应该只拾取 4 个词的名词短语并删除(3 个和 2 个词)其余部分。如何强制执行此解决方案,例如 Python NLTK 具有备份标记器选项?

抽象策略 ->this is incorrect>
抽象策略板 ->incorrect
抽象策略棋盘游戏 -> this should be the correct output

口音行政
口音行政简单
口音行政简单评论

非常感谢。

0 投票
2 回答
3233 浏览

java - R包中的RWeka错误

我已经搜索了 SO 和其他任何地方,但没有任何方法可以修复不受支持的 major.minor 版本 51 错误。我卸载了 Java 8 并安装了 Java 7。没有运气。谢谢您的帮助。我正在使用:R 3.3.1 Java 8.91 OSX,el capitan library(NLP) library(tm) library(RWeka) library(rJava) library((RWekajars)) library(parallel) options(mc.cores=1) 这里是导致错误的 R 代码:

0 投票
1 回答
559 浏览

r - R 错误中的 n-grams:无效的“次”参数

我正在尝试遵循此示例,但遇到了错误。

有任何想法吗?

0 投票
1 回答
1054 浏览

r - RWeka - R 3.3.0 中的 J48 函数

我正在做一个流失项目,遇到了一个 J48 树函数。要求的包裹是 RWeka 和派对。但是当我加载库(RWeka)时,我收到一个错误

这个问题的任何解决方法?