问题标签 [qdap]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
69 浏览

r - 用R中的英文单词替换年份

我需要预处理语音记录以进行强制对齐。但是,我很难用文本表示替换年份。比如1984就需要换成“十九八十四”。我尝试了 qdap 包的 replace_number 功能。这个包很棒,但是它用“一千九百八十四”代替了1984。我可以尝试来自任何 R 包的其他功能吗?谢谢!

0 投票
4 回答
2787 浏览

r - 在 R 中安装 rJava 或 qdap 的问题

尝试安装 qdap 或 rJava 时,总是返回 image not found 错误

库(rJava)错误:'rJava'的包或命名空间加载失败:'rJava'的loadNamespace()中的.onLoad失败,详细信息:调用:dyn.load(文件,DLLpath = DLLpath,...)错误:无法加载共享对象'/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rJava/libs/rJava.so':dlopen(/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rJava /libs/rJava.so, 6):库未加载:@rpath/libjvm.dylib 引用自:/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rJava/libs/rJava.so 原因:图像未找到 Blockquote

我遵循了这个早期线程上的每条指令,仍然不起作用,同样的错误消息。

R 版本 3.4.0 (2017-04-21) 平台:x86_64-apple-darwin15.6.0 (64-bit) 运行于:OS X El Capitan 10.11.6

矩阵产品:默认 BLAS:/System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib LAPACK:/Library/Frameworks/R.framework/Versions/3.4/Resources /lib/libRlapack.dylib

0 投票
1 回答
62 浏览

r - 似乎无法让矢量化 gsub 与库“qdap”和 mgsub 一起使用

我在看这个问题:

R:gsub,模式=向量和替换=向量

我正在尝试一个简单的例子,但我无法让它工作。

这个输出不应该:

0 投票
0 回答
38 浏览

r - 您可以在没有导入或依赖项的情况下在 R 中安装包吗?

我在无法访问 Internet 的计算机上工作。我下载了我所有的 R 包并从 .zip 文件中安装它们。然而,一个问题是,当我安装一个包时,它将需要其他包,因为我将它们加载到库中。

例如,我下载了 QDAP,它说“在您下载并安装 rJava 之前无法加载”。使用几个不同的包多次发生这种情况。有没有办法避免这种情况?我不需要“wordcloud 包,但它要求我在使用 QDAP 之前安装它。

0 投票
2 回答
201 浏览

r - 随着时间的推移按组查找重复的句子/单词/短语

我有一个数据集,其中每一列都是一个变量,每一行是一个观察值(如时间序列数据。它看起来像这样(我为格式道歉,但我无法显示数据):

在此处输入图像描述

我想知道一个人或一个团体是否随着时间的推移在说同样的事情。我对 n-gram 很熟悉,但这并不是我所需要的。任何帮助,将不胜感激。 在此处输入图像描述

这是我想要的输出:

很抱歉所有的编辑差评;还是习惯了网站。

0 投票
0 回答
60 浏览

r - 使用 R QDAP:无法分配内存

我尝试在 QDAP 中使用各种函数,例如 word_cor、word_associate 等,但我不断收到一条错误消息,上面写着“无法分配 1.5gb 的向量内存”(类似于这些行)。

但是,我不需要该函数来返回 word_cor(等)的所有结果,即使相关性为 0.7。我只想要前50名左右。

我可以/应该在 dpylr 中使用 top_n 函数,还是有另一种方法可以显着降低回报?我研究过稀疏矩阵,但我认为这不是我需要的。

0 投票
2 回答
2373 浏览

r - 如何将 Dataframe 转换为 DTM

我想将我的表转换为 DTM 并维护元数据。

相同的数据

每行都应该是一个文档。但是为了使用 cast_dtm(),需要有一个计数变量。为了“投射”,它需要采用“文档、术语、计数”格式。

如何将我的数据转换为“文档、术语、计数”数据框?从那里,很容易转换成 DTM,然后做我需要的。

0 投票
1 回答
98 浏览

r - dplyr 过滤器使用 qdap::which_misspelt 或 dplyr 过滤器与嵌套函数

一个小数据框:

如果我使用qdap::which_misspelled,我可以找出拼写错误的单词:

但我想做的是在包含拼写错误的行上对单词 df 进行子集化。以上返回索引 1 和 8 引用我的 df 中提供的所有单词,无论哪一行。

如何根据包含拼写错误的任何行对我的 df 进行子集化?

(如果可以使用 dplyr 过滤器完成,则奖励)

0 投票
1 回答
212 浏览

r - 基于频率表的子集/过滤器

我有一个带有一些文本数据的df,例如

我已经能够根据包含拼写错误的任何行进行子集化:

但鉴于我有很多文本数据,我只想过滤更频繁发生的拼写错误:

所以我现在知道“qhick”是一个常见的拼写错误。

然后我怎么能根据这张表子集单词呢?所以只返回包含“qhick”的行?

0 投票
0 回答
394 浏览

r - 将单词添加到 R 中的 qdap 字典

我正在使用 qdap 包进行拼写检查,但默认字典没有很多单词,例如城市、州、国家或语言。我知道我可以将单词添加到字典中,如下所示

但我想知道是否有更有效的方法可以将大约 1000 个单词添加到字典中。

谢谢