问题标签 [rweka]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

101 问题

0 投票

1 回答

2267 浏览

r - Knitr 提供与 RStudio 不同的结果

我正在使用 Knitr 使用“tm”和“RWeka”进行一些初始文本挖掘，以实现可重复性。

我正在尝试获取基于两个文本文件的语料库的术语文档矩阵，当我在 RStudio 中运行代码以及将其编入 HTML 文件时，该过程会产生不同的结果：

...当我尝试其他文档输出 PDF 和 Word 输出时：

同意 RStudio。

而且，我需要一个 HTML 输出....

知道会发生什么吗？

这是.Rmd代码

```

sessionInfo() R 版本 3.2.3 (2015-12-10) 平台：x86_64-apple-darwin13.4.0 (64-bit) 运行于：OS X 10.11.4 (El Capitan)

语言环境：[3] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8

附加的基础包：[3] stats graphics grDevices utils datasets methods base

其他附加包：[3] R.utils_2.2.0 R.oo_1.20.0 R.methodsS3_1.7.1 dplyr_0.4.3 xtable_1.8-0
[6] pander_0.6.0 RWeka_0.4-24 SnowballC_0.5.1 tm_0.6-2 NLP_0 .1-9
[11] knitr_1.12.3

r knitr rweka

2016-03-30T02:29:06.473

0 投票

1 回答

393 浏览

java - 无法在 Mac OS X El Capitan 上的 R 中使用 FSelector 包

我现在使用的是 OS X El Capitan 版本 10.11.3。

当我尝试library(FSelector)在 R 中使用时，会弹出错误消息：

此外，当我尝试library(Rweka)和library(Rwekajars).

为什么会发生这种情况以及如何解决？

java r macos rweka fselector

2016-04-14T15:27:44.547

0 投票

0 回答

71 浏览

r - J48并联运行

我收到以下错误：

我想创建并行模型（J48）。这样将为每个子数据集建立一个模型。例如，对于iris_dataset[[1]]J48 将是j48_c.models[[1]]... 而对于iris_dataset[[18]]J48 将是j48_c.models[[18]].

您可以通过以下方式单独运行模型：

r foreach doparallel j48 rweka

2016-04-25T20:24:48.187

0 投票

1 回答

449 浏览

r - 在 R 中将关键术语（语料库）搜索到另一个

我之前问过这个问题并得到了负面反馈，因为我没有提供代码。我花了一整天的时间尝试和尝试，现在我陷入了一个问题。

此代码已由 Stackoverflow 中的用户“Tyler Rincker”<-非常感谢他！

这是代码：

我的问题是我想在语料库中搜索二元组或三元组（2 或 3 个单词）。

当我执行这行代码时：

我得到的结果应该显示频率为“1”。

但是，如果关键字只有 1 个单词：

代码工作正常，我得到以下结果：

非常感谢！并希望有人可以提供帮助。

r text-mining tm text-analysis rweka

2016-05-04T16:12:11.507

0 投票

2 回答

2194 浏览

java - RWeka 在 OSX 10.10.5 下抛出 java.lang.UnsupportedClassVersionError

当我尝试创建分类器时，在 OS 10.5.5 下使用 RWeka 0.4-28 收到以下错误消息：

.jnew("weka/core/Attribute", attname[i], .jcast(levels, "java/util/List")) 中的错误：java.lang.UnsupportedClassVersionError: weka/core/Attribute：不支持的major.minor 版本51.0

我已经签入终端并且我的 Java 是最新的

这是 RWeka 中的错误还是我的配置中的错误？

java r rweka

2016-06-04T20:43:49.727

0 投票

1 回答

332 浏览

r - RWeka 不能与插入符号或可能的 %dopar% 一起使用

我正在完成caret作者的应用预测建模（该软件包的 R 教科书）中的练习。我无法train使用方法M5P或M5Rules.

代码将手动运行良好：

相同的数据和控件（将“规则”替换为“M” -为什么我不能将 M 指定为调整参数？）将无法完成：

书中的示例也不会完成：

至少对我来说，这可能是与 RWeka 一起使用并行后端的问题。我上面的例子不会以%dopar%.

我sudo R CMD javareconf在每个示例之前运行并重新启动了 Rstudio。

r weka r-caret doparallel rweka

2016-06-05T17:55:29.987

0 投票

1 回答

178 浏览

r - 如何在 RWeka 中实现备份标记器开关？

我正在使用 R-tm-Rweka 包进行一些文本挖掘。我必须提取 ngram，而不是在单个单词上构建 tf-tdm，这对我的目的来说还不够。我使用@Ben函数TrigramTokenizer <- function(x) NGramTokenizer(x, Weka_control(min = 2, max = 3)) tdm <- TermDocumentMatrix(a, control = list(tokenize = TrigramTokenizer))
来提取三元组。输出有一个明显的错误，见下文。它会选择 4 个、3 个和 2 个单词的短语。理想情况下，它应该只拾取 4 个词的名词短语并删除（3 个和 2 个词）其余部分。如何强制执行此解决方案，例如 Python NLTK 具有备份标记器选项？

抽象策略 ->this is incorrect>
抽象策略板 ->incorrect
抽象策略棋盘游戏 -> this should be the correct output

口音行政
口音行政简单
口音行政简单评论

非常感谢。

r text-mining tm rweka

2016-06-10T14:37:22.500

0 投票

2 回答

3233 浏览

java - R包中的RWeka错误

我已经搜索了 SO 和其他任何地方，但没有任何方法可以修复不受支持的 major.minor 版本 51 错误。我卸载了 Java 8 并安装了 Java 7。没有运气。谢谢您的帮助。我正在使用：R 3.3.1 Java 8.91 OSX，el capitan library(NLP) library(tm) library(RWeka) library(rJava) library((RWekajars)) library(parallel) options(mc.cores=1) 这里是导致错误的 R 代码：

java r rweka

2016-06-14T16:54:12.243

0 投票

1 回答

559 浏览

r - R 错误中的 n-grams：无效的“次”参数

我正在尝试遵循此示例，但遇到了错误。

有任何想法吗？

r tm rweka

2016-07-27T23:43:35.933

0 投票

1 回答

1054 浏览

r - RWeka - R 3.3.0 中的 J48 函数

我正在做一个流失项目，遇到了一个 J48 树函数。要求的包裹是 RWeka 和派对。但是当我加载库（RWeka）时，我收到一个错误

这个问题的任何解决方法？

r decision-tree rweka

2016-08-03T16:57:15.813

1 2 3 4 5 6 7 8 9 10

问题标签 [rweka]

```

Reference