问题标签 [qdap]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

109 问题

0 投票

1 回答

69 浏览

r - 用R中的英文单词替换年份

我需要预处理语音记录以进行强制对齐。但是，我很难用文本表示替换年份。比如1984就需要换成“十九八十四”。我尝试了 qdap 包的 replace_number 功能。这个包很棒，但是它用“一千九百八十四”代替了1984。我可以尝试来自任何 R 包的其他功能吗？谢谢！

r nlp text-to-speech speech-synthesis qdap

2017-05-12T04:25:08.147

0 投票

4 回答

2787 浏览

r - 在 R 中安装 rJava 或 qdap 的问题

尝试安装 qdap 或 rJava 时，总是返回 image not found 错误

库（rJava）错误：'rJava'的包或命名空间加载失败：'rJava'的loadNamespace（）中的.onLoad失败，详细信息：调用：dyn.load（文件，DLLpath = DLLpath，...）错误：无法加载共享对象'/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rJava/libs/rJava.so'：dlopen(/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rJava /libs/rJava.so, 6)：库未加载：@rpath/libjvm.dylib 引用自：/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rJava/libs/rJava.so 原因：图像未找到 Blockquote

我遵循了这个早期线程上的每条指令，仍然不起作用，同样的错误消息。

R 版本 3.4.0 (2017-04-21) 平台：x86_64-apple-darwin15.6.0 (64-bit) 运行于：OS X El Capitan 10.11.6

矩阵产品：默认 BLAS：/System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib LAPACK：/Library/Frameworks/R.framework/Versions/3.4/Resources /lib/libRlapack.dylib

r rjava qdap

2017-05-18T13:35:44.040

0 投票

1 回答

62 浏览

r - 似乎无法让矢量化 gsub 与库“qdap”和 mgsub 一起使用

我在看这个问题：

R：gsub，模式=向量和替换=向量

我正在尝试一个简单的例子，但我无法让它工作。

这个输出不应该：

r regex vectorization qdap

2017-06-02T19:14:31.370

0 投票

0 回答

38 浏览

r - 您可以在没有导入或依赖项的情况下在 R 中安装包吗？

我在无法访问 Internet 的计算机上工作。我下载了我所有的 R 包并从 .zip 文件中安装它们。然而，一个问题是，当我安装一个包时，它将需要其他包，因为我将它们加载到库中。

例如，我下载了 QDAP，它说“在您下载并安装 rJava 之前无法加载”。使用几个不同的包多次发生这种情况。有没有办法避免这种情况？我不需要“wordcloud 包，但它要求我在使用 QDAP 之前安装它。

r qdap tidytext

2017-06-14T21:05:32.340

0 投票

2 回答

201 浏览

r - 随着时间的推移按组查找重复的句子/单词/短语

我有一个数据集，其中每一列都是一个变量，每一行是一个观察值（如时间序列数据。它看起来像这样（我为格式道歉，但我无法显示数据）：

我想知道一个人或一个团体是否随着时间的推移在说同样的事情。我对 n-gram 很熟悉，但这并不是我所需要的。任何帮助，将不胜感激。

这是我想要的输出：

很抱歉所有的编辑差评；还是习惯了网站。

r regex tm qdap tidytext

2017-06-15T13:57:59.470

0 投票

0 回答

60 浏览

r - 使用 R QDAP：无法分配内存

我尝试在 QDAP 中使用各种函数，例如 word_cor、word_associate 等，但我不断收到一条错误消息，上面写着“无法分配 1.5gb 的向量内存”（类似于这些行）。

但是，我不需要该函数来返回 word_cor（等）的所有结果，即使相关性为 0.7。我只想要前50名左右。

我可以/应该在 dpylr 中使用 top_n 函数，还是有另一种方法可以显着降低回报？我研究过稀疏矩阵，但我认为这不是我需要的。

r dplyr sparse-matrix text-mining qdap

2017-06-16T16:15:11.933

0 投票

2 回答

2373 浏览

r - 如何将 Dataframe 转换为 DTM

我想将我的表转换为 DTM 并维护元数据。

每行都应该是一个文档。但是为了使用 cast_dtm()，需要有一个计数变量。为了“投射”，它需要采用“文档、术语、计数”格式。

如何将我的数据转换为“文档、术语、计数”数据框？从那里，很容易转换成 DTM，然后做我需要的。

r tidy quanteda qdap tidytext

2017-06-21T15:43:20.840

0 投票

1 回答

98 浏览

r - dplyr 过滤器使用 qdap::which_misspelt 或 dplyr 过滤器与嵌套函数

一个小数据框：

如果我使用qdap::which_misspelled，我可以找出拼写错误的单词：

但我想做的是在包含拼写错误的行上对单词 df 进行子集化。以上返回索引 1 和 8 引用我的 df 中提供的所有单词，无论哪一行。

如何根据包含拼写错误的任何行对我的 df 进行子集化？

（如果可以使用 dplyr 过滤器完成，则奖励）

r dplyr qdap

2017-06-30T00:39:48.070

0 投票

1 回答

212 浏览

r - 基于频率表的子集/过滤器

我有一个带有一些文本数据的df，例如

我已经能够根据包含拼写错误的任何行进行子集化：

但鉴于我有很多文本数据，我只想过滤更频繁发生的拼写错误：

所以我现在知道“qhick”是一个常见的拼写错误。

然后我怎么能根据这张表子集单词呢？所以只返回包含“qhick”的行？

r qdap

2017-06-30T01:49:55.823

0 投票

0 回答

394 浏览

r - 将单词添加到 R 中的 qdap 字典

我正在使用 qdap 包进行拼写检查，但默认字典没有很多单词，例如城市、州、国家或语言。我知道我可以将单词添加到字典中，如下所示

但我想知道是否有更有效的方法可以将大约 1000 个单词添加到字典中。

谢谢

r dictionary spell-checking qdap

2017-07-03T22:30:52.903

1 2 3 4 5 6 7 8 9 10