问题标签 [rweka]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Knitr 提供与 RStudio 不同的结果
我正在使用 Knitr 使用“tm”和“RWeka”进行一些初始文本挖掘,以实现可重复性。
我正在尝试获取基于两个文本文件的语料库的术语文档矩阵,当我在 RStudio 中运行代码以及将其编入 HTML 文件时,该过程会产生不同的结果:
...当我尝试其他文档输出 PDF 和 Word 输出时:
同意 RStudio。
而且,我需要一个 HTML 输出....
知道会发生什么吗?
这是.Rmd
代码
```
sessionInfo() R 版本 3.2.3 (2015-12-10) 平台:x86_64-apple-darwin13.4.0 (64-bit) 运行于:OS X 10.11.4 (El Capitan)
语言环境:[3] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
附加的基础包:[3] stats graphics grDevices utils datasets methods base
其他附加包:[3] R.utils_2.2.0 R.oo_1.20.0 R.methodsS3_1.7.1 dplyr_0.4.3 xtable_1.8-0
[6] pander_0.6.0 RWeka_0.4-24 SnowballC_0.5.1 tm_0.6-2 NLP_0 .1-9
[11] knitr_1.12.3
java - 无法在 Mac OS X El Capitan 上的 R 中使用 FSelector 包
我现在使用的是 OS X El Capitan 版本 10.11.3。
当我尝试library(FSelector)
在 R 中使用时,会弹出错误消息:
此外,当我尝试library(Rweka)
和library(Rwekajars)
.
为什么会发生这种情况以及如何解决?
r - J48并联运行
我收到以下错误:
我想创建并行模型(J48)。这样将为每个子数据集建立一个模型。例如,对于iris_dataset[[1]]
J48 将是j48_c.models[[1]]
... 而对于iris_dataset[[18]]
J48 将是j48_c.models[[18]]
.
您可以通过以下方式单独运行模型:
r - 在 R 中将关键术语(语料库)搜索到另一个
我之前问过这个问题并得到了负面反馈,因为我没有提供代码。我花了一整天的时间尝试和尝试,现在我陷入了一个问题。
此代码已由 Stackoverflow 中的用户“Tyler Rincker”<-非常感谢他!
这是代码:
我的问题是我想在语料库中搜索二元组或三元组(2 或 3 个单词)。
当我执行这行代码时:
我得到的结果应该显示频率为“1”。
但是,如果关键字只有 1 个单词:
代码工作正常,我得到以下结果:
非常感谢!并希望有人可以提供帮助。
java - RWeka 在 OSX 10.10.5 下抛出 java.lang.UnsupportedClassVersionError
当我尝试创建分类器时,在 OS 10.5.5 下使用 RWeka 0.4-28 收到以下错误消息:
.jnew("weka/core/Attribute", attname[i], .jcast(levels, "java/util/List")) 中的错误:java.lang.UnsupportedClassVersionError: weka/core/Attribute:不支持的major.minor 版本51.0
我已经签入终端并且我的 Java 是最新的
这是 RWeka 中的错误还是我的配置中的错误?
r - RWeka 不能与插入符号或可能的 %dopar% 一起使用
我正在完成caret
作者的应用预测建模(该软件包的 R 教科书)中的练习。我无法train
使用方法M5P
或M5Rules
.
代码将手动运行良好:
相同的数据和控件(将“规则”替换为“M” -为什么我不能将 M 指定为调整参数?)将无法完成:
书中的示例也不会完成:
至少对我来说,这可能是与 RWeka 一起使用并行后端的问题。我上面的例子不会以%dopar%
.
我sudo R CMD javareconf
在每个示例之前运行并重新启动了 Rstudio。
r - 如何在 RWeka 中实现备份标记器开关?
我正在使用 R-tm-Rweka 包进行一些文本挖掘。我必须提取 ngram,而不是在单个单词上构建 tf-tdm,这对我的目的来说还不够。我使用@Ben函数TrigramTokenizer <- function(x) NGramTokenizer(x, Weka_control(min = 2, max = 3))
tdm <- TermDocumentMatrix(a, control = list(tokenize = TrigramTokenizer))
来提取三元组。输出有一个明显的错误,见下文。它会选择 4 个、3 个和 2 个单词的短语。理想情况下,它应该只拾取 4 个词的名词短语并删除(3 个和 2 个词)其余部分。如何强制执行此解决方案,例如 Python NLTK 具有备份标记器选项?
抽象策略 ->this is incorrect
>
抽象策略板 ->incorrect
抽象策略棋盘游戏 -> this should be the correct output
口音行政
口音行政简单
口音行政简单评论
非常感谢。
java - R包中的RWeka错误
我已经搜索了 SO 和其他任何地方,但没有任何方法可以修复不受支持的 major.minor 版本 51 错误。我卸载了 Java 8 并安装了 Java 7。没有运气。谢谢您的帮助。我正在使用:R 3.3.1 Java 8.91 OSX,el capitan library(NLP) library(tm) library(RWeka) library(rJava) library((RWekajars)) library(parallel) options(mc.cores=1) 这里是导致错误的 R 代码:
r - R 错误中的 n-grams:无效的“次”参数
我正在尝试遵循此示例,但遇到了错误。
有任何想法吗?
r - RWeka - R 3.3.0 中的 J48 函数
我正在做一个流失项目,遇到了一个 J48 树函数。要求的包裹是 RWeka 和派对。但是当我加载库(RWeka)时,我收到一个错误
这个问题的任何解决方法?