问题标签 [rweka]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 'RWeka' 的包或命名空间加载失败
所以,我在我的 MacBook OS X El Capitan 版本 10.11.6 上安装了 RWeka,但是当我运行
我得到错误
我的 R 版本是
当我在 Mac 终端中运行时:
我也试过
这导致
有人可以帮我正确加载 RWeka 吗?
我已经在我的电脑上安装了 Weka。我在 R Studio 中也安装了“rJava”。我不明白这个问题。
我尝试了很多东西,甚至安装了 1.6,但我在最新版本的 java Terminal 中的最终输出是:
我花了 4 个小时才解决了这个问题。似乎在 mac 系统版本更新后,java 版本首选项选项被删除了。
weka - 如何将 10-fcv weka 预测结果链接回原始评论以进行文本分类
无论如何,我可以在使用 10 倍交叉验证进行文本分类后将我的预测结果路由回原始评论吗?
从类 non-sarc 和 sarc 的 2000 条评论的结果来看:
看起来 weka 在等待培训和测试之前重新安排了我对班级划分的评论。我如何将此结果引用到未按顺序排列的原始评论(不像 10-fcv 之后)?我已经尝试将评论重新安排到非 sarc 和 sarc 的类序列,但我混淆了哪个测试/培训首先,是首先折叠测试,还是最后折叠测试,或其他?
提前致谢。
r - R中的文档项矩阵-二元标记器不起作用
我正在尝试为语料库制作 2 个文档术语矩阵,一个带有 unigrams,一个带有 bigrams。但是,二元矩阵目前与一元矩阵完全相同,我不知道为什么。
编码:
我还尝试使用 ngram 包中的 ngram(x, n=2) 作为标记器,但这也不起作用。如何修复二元标记化?
r - 使用 tm 和 RWeka 创建 N-Grams - 适用于 VCorpus 但不适用于 Corpus
遵循使用 'tm' 和 'RWeka' 包创建biGrams的许多指南后,我对tdm中只返回1-Grams感到沮丧。经过多次反复试验,我发现使用“ VCorpus ”实现了正确的功能,但没有使用“ Corpus ”。顺便说一句,我很确定这在大约 1 个月前与“语料库”合作,但现在不是。
R (3.3.3)、RTools (3.4)、RStudio (1.0.136) 和所有软件包(tm 0.7-1、RWeka 0.4-31)已更新到最新版本。
如果其他人有同样的问题,我将不胜感激。
结果与“语料库”
'VCorpus' 的结果
ld - ldconfig rJava 不起作用
我正在开发一个需要 rJava 和 RWeka 的开源 R 包,并且不知何故 rJava 和 RWeka在我的本地机器上神秘地中断了。
任何人都知道为什么 rJava 会崩溃?
系统似乎找不到共享对象,所以我做了以下两个:
sudo ldconfig -l /home/sunxd/R/x86_64-pc-linux-gnu-library/3.3/rJava/libs/rJava.so
此外,我添加/home/sunxd/R/x86_64-pc-linux-gnu-library/3.3/rJava/libs/rJava.so
并/etc/ld.so.conf
运行sudo ldconfig
然后我跑ldconfig -p | grep rJava
,根本没有回报。有谁知道为什么?是不是因为 rJava.so 坏了所以没有出现在缓存中?如果是这样,我如何检查 .so 文件是否损坏?
r - 安装 RWeka 时遇到问题
我一直在尝试通过 ipython notebook 为 R 安装 RWeka,但出现错误。我有 ubuntu 16.10
我尝试了以下命令
最后当我跑步时
我收到以下错误。任何帮助,将不胜感激。
r - 使用 RWeka 的 2-gram 和 3-gram 而不是 1-gram
我正在尝试使用 RWeka NGramTokenizer 函数从火车语料库中提取 1-gram、2-gram 和 3-gram。不幸的是,只得到 1 克。有我的代码:
每次都得到相同的结果,这显然是错误的。
只有 1 克。我试图用以下方式重写我的命令:
但没有成功。还尝试添加另一行:
在 NgramTokenizer 命令之前,但没有变化。有什么帮助吗?
r - 如何执行 jar 文件并捕获输出以在我的 R 脚本中使用?
我使用的 jar 文件有一堆文本文件的输出。我想使用这些文件进行文本挖掘。而不是单独执行 jar 文件,然后将输出用于我的 R 脚本,我希望我的 R 脚本也启动 jar 执行。有没有办法做到这一点?
r - 安装包 rweka 时出错,但是 rjava 是最新的
我正在尝试安装包 RWeka。我安装了 java 版本 8,但我不断收到此错误。有人可以帮忙吗?