问题标签 [qdap]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2567 浏览

r - 库中的错误(qdap):没有名为“qdap”的包

我已经安装了 qdap:

下载所有内容需要一段时间,但控制台会填满所有下载内容,最后我收到如下消息:

这篇SO 帖子让我尝试添加dependencies = TRUE,但问题仍然存在。

这是会话信息

我昨天发现的另一篇文章(现在用 Google 搜索找不到了)建议我删除我的库目录中现有的 qdap 文件,关闭我的会话,重新启动并全新安装。没有完全称为 qdap 的软件包,但我删除了一些名称中带有 qdap 的软件包。我的问题仍然存在,我无法安装 qdap。

我不确定要提供哪些其他信息?任何帮助表示赞赏。

以下是尝试安装 qdap 时产生的错误:

./configure:第 3736 行:/usr/lib/jvm/default-java/jre/bin/java:没有这样的文件或目录没有配置:错误:Java 解释器'/usr/lib/jvm/default-java/jre/ bin/java'不起作用错误:包'rJava'的配置失败*删除'/home/myname/R/x86_64-pc-linux-gnu-library/3.4/rJava' install.packages中的警告:安装包' rJava'有非零退出状态错误:依赖'rJava'不适用于包'openNLPdata' *删除'/home/myname/R/x86_64-pc-linux-gnu-library/3.4/openNLPdata'安装警告。包:安装包'openNLPdata'的退出状态非零错误:依赖'rJava'不适用于包'xlsxjars' *删除'/home/myname/R/x86_64-pc-linux-gnu-library/3.4/ install.packages 中的 xlsxjars 警告:安装包“xlsxjars”的退出状态非零错误:依赖项“rJava”不适用于包“venneuler”*删除“/home/myname/R/x86_64-pc-linux-gnu-library/3.4/venneuler” install.packages 中的警告:安装包“venneuler”的退出状态非零错误:依赖项“openNLPdata”、“rJava”不适用于包“openNLP”*删除“/home/myname/R/x86_64-pc- linux-gnu-library/3.4/openNLP' install.packages中的警告:安装包'openNLP'的退出状态非零错误:依赖项'rJava','xlsxjars'不适用于包'xlsx' *删除'/ home/myname/R/x86_64-pc-linux-gnu-library/3.4/xlsx' install.packages 中的警告:安装包'xlsx'的退出状态非零错误:依赖项'openNLP','venneuler','xlsx' 不适用于包 'qdap' * 删除 '/home/myname/R/x86_64-pc-linux-gnu-library/3.4/qdap' install.packages 中的警告:安装包 'qdap' 没有零退出状态

因为这看起来像一个 rJava 问题,所以我找到了这篇文章,并在终端中尝试了投票最高的答案:

结果:

我希望在不成为 root 用户的情况下解决这个问题?我对linux不太熟悉。我能够安装其他 p 包。

0 投票
1 回答
252 浏览

r - 在 tm::content_transformer() 的上下文中,我将如何使用 mgsub?

qdap:: mgsub采用以下参数:

在 library(tm) 语料库转换中,您可以将非 tm 函数包装在 中content_transformer(),例如

这是一个带有一些拼写错误的文本的数据框:

这是一个自定义查找拼写错误单词的数据框:

在 corpus 和 content_transformer() 的上下文中使用 mgsub 我可以这样做:

但是我看不到如何在函数中编写 mgsub 以传递给content_transformer()我的 x 参数在 mgsub(x, pattern, replacement) 中是什么?

0 投票
0 回答
62 浏览

r - 使用 qdap::check_spelling 需要很长时间,我可以提高效率吗

我正在尝试使用qdap::check_spelling()7M 非常短的句子(例如 1 - 4 个单词的句子)。

我正在通过 ssh/linux 运行脚本,运行大约 6 个小时后,我收到一条“已终止”消息,我认为这意味着我正在使用大量内存?我正在使用 64GB 的服务器。

我的目标是返回一个数据框以写入具有以下字段的 csv:

按频率降序排列以查找最常见的拼写错误的单词。一旦我生成了这个,我们就有一个支持团队,他们将解决最常见的拼写错误并尽可能多地纠正。他们询问拼写错误单词的一些上下文,即在更大的句子中看到它们。因此,我尝试使用拉出拼写错误单词的第一个实例并添加到第三列。

例子:

这是它的样子:

这正是我想要的!但我正在努力在我的文本中包含 7m 文档的真实数据集上运行它。该脚本运行了几个小时,然后在终端中发送一条“已终止”消息。

我可以将其分解并以块的形式循环数据。但在我这样做之前,有没有更好的方法来实现我的目标?

0 投票
1 回答
851 浏览

r - 如何避免与“通过命名空间加载(且未附加)”的包发生类名冲突(qdap & openssl)

使用该qdap::polarity()函数有时会遇到错误:

derived_pubkey(key) 中的错误:RAW() 只能应用于“原始”,而不是“列表”

我相当确定这是由于qdapkey类与openssl包的类冲突key(因为在错误消息中引用了derive_pubkey()from )。openssl

openssl出现在 的loaded via a namespace (and not attached):部分时会发生错误sessionInfo(),并且它似乎会抛出关键类的方法调度并导致错误。

我只能通过重新启动我的 R 会话来修复错误。有没有办法openssl从会话中删除 's 的足迹来解决这个问题?或者是否有另一种方法可以在不重新启动 R 的情况下避免此问题?

重现错误

0 投票
1 回答
2397 浏览

r - 比较两个文档中的词袋并找到第二个文档中的匹配词及其频率

我计算了“yelp.csv”、“yelpp.csv”、“yelpn.csv”的词袋,并创建了个人数据集的词频矩阵。现在,我想将 yelp 的词袋与 yelpn 进行比较,并检查 yelp 中有多少词出现在 yelpn 中以及它们的频率,并将其存储在一个变量中作为矩阵,然后对于 yelpp 也是如此。yelp包含正面和负面。yelpp,只有正面和 yelpn,只有负面。任何人都可以完成代码吗?我不知道这段代码是否相关,我希望如此。

0 投票
3 回答
44 浏览

r - 数据帧上 qdap 包应用程序的 word_stats 函数

我有一个数据框,其中一列包含字符串。

我想对每个单独的记录使用 word_stats 函数。可能吗?

0 投票
0 回答
45 浏览

r - tm 包/qdap 输出中出现的特殊字符

我正在尝试使用以下数据集在 R 中创建术语文档矩阵

提前体验手机。谢谢你钦奈限期优惠

我使用过 qdap 和 freq_terms。以下是预期的输出

以下特殊字符不断出现,使数据不合适。

我已经使用 gsub 来替换这些字符,但它不是很有效。有人可以建议一种方法吗?

0 投票
1 回答
3173 浏览

r - 在 R 中加载“qdap”包失败

我已经浏览了与 qdap 相关的线程,但他们的问题与我的不同。此外,他们中的许多人没有公认的答案。我安装了 'qdap' 包,但是当我使用 加载它时library(qdap),它返回以下错误:

错误:loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]) 中“qdap”的包或命名空间加载失败:没有名为“openNLPdata”的包</p>

我什至尝试过install.packages("qdap", dependencies = TRUE),但这没有任何区别。这方面的任何信息都会有所帮助。

0 投票
1 回答
100 浏览

r - 让 qdap 放大器应用于否定词

R 3.4.3,使用qdap::polarity(),我想知道是否有办法让放大器应用于否定词而不是实际词本身。在下面的例子中,“love”是肯定词,“didn't”是否定词,“肯定”是放大词。我想让短语“a”的极性得分更高,但似乎“肯定”是在放大“爱”而不是“不爱”。

提前致谢,-jt

0 投票
0 回答
110 浏览

r - 限制R中字符列中的字数并将多余的单词保存在另一个变量中

我们正在将数据从旧的 ERP 系统转移到新的系统,新系统将项目描述限制为 50 个单词,而旧系统则没有这样的限制。如果字符串末尾的单词超过 50,我如何要求 R 删除它们?

编辑:建议的解决方案是给我一个描述列,每个 50 个单词,但是,当单词少于 50 个时,它将 NA 代替单词,直到它产生 50 个单词。另外,被移除的部分不会存储在任何地方。

我使用 qdap 包中的 word_count 来计算单词的数量,并将新变量插入到原始数据帧中。现在如何使用此列删除第 50 个单词之后的所有单词(如果单词数>50)?我正在考虑使用计数> 50的单词位置?我想将多余的词放入另一个名为“扩展描述”的现有列中。

输入数据:仅此处的分隔符 &&,(实际上是 R 中的数据框)

数据图片

在此处输入图像描述