问题标签 [qdap]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

109 问题

0 投票

2 回答

44 浏览

r - 将特殊字符保存在词频矩阵中

我在文本中分析了一些品牌，以找出 KPI，例如广告识别。但是到目前为止，包含特殊字符的品牌都被我的代码破坏了。

这是输出：

有没有一种包装或方法来归档 H&M 得到 h&m，而不是像它的两个品牌那样的“h”和“m”？

编辑： wfm 函数有一个 ... 参数，应该允许我使用 strip 函数。

不幸的是不起作用。

r text-mining stringr qdap

user7353167

2018-11-18T10:52:30.920

0 投票

1 回答

115 浏览

r - 从 .docx 中删除 R 中的特殊字符

我看过各种关于删除 R 中的特殊字符的帖子（例如这篇文章：Remove all special characters from a string in R?），但没有一个策略对我的问题有效。

我有一份我正在使用 qdap 的 read.transcript() 阅读的成绩单。当我在文档中阅读时，它使带有特殊字符的行看起来像这样：

我努力了：

但这不会删除特殊字符，也会删除 !

我也试过：

但这更糟糕，并且删除了所有标点符号，但仍然无法解决我的问题。

最后，我也试过：

但这里也没有任何改变。

在理想世界中，输出如下所示：

因此，特殊字符被读入它们“应该”的样子。如果这是不可能的，老实说，如果它只是删除特殊字符（但不是其他字符，如感叹号）并看起来像这样，我真的可以：

谢谢！

r regex string gsub qdap

2018-12-11T18:25:24.830

0 投票

4 回答

71 浏览

r - 根据最后 n 个字符提取值

我有一个如下所示的向量：

如何提取最后 3 个值，以便我的结果基于-分隔符如下所示：

我尝试使用 sub 和 qdap 包，但没有运气。

不知道该怎么做。

r regex gsub qdap

2019-01-10T23:43:34.017

0 投票

1 回答

131 浏览

r - 防止 rm_stopwords 函数创建列表

我使用包中的rm_stopwords函数从qdap数据框中的文本列中删除停用词和标点符号。

该函数返回 reviewText 列的列表。

关于如何防止它（即保留原始格式）或取消列出/取消嵌套列并返回原始格式的任何想法？

结果应该与原始数据框中的结果类似，但没有停用词和标点符号。

这是一个小输入：

r qdap

2019-01-26T16:42:17.370

0 投票

1 回答

271 浏览

inner-join - 基于情感分析将自定义（加权）字典应用于文本

我正在寻找调整此代码，以便我可以为这些情态动词中的每一个分配不同的权重。这个想法是使用类似于 NRC 库的东西，其中我们有 1-5 的“数字”代表类别，而不是数字。

我的问题是，当我运行以下代码时，我有 5 个“可能”与一个“必须”一样。我想要的是每个单词都有不同的权重，这样当我运行这个分析时，我可以看到更强的“必须”与说更弱的“可以”的使用集中度。*“tidy.DF”是我的语料库，“school”和“target”是列名。

inner-join text-mining tm quanteda qdap

2019-02-01T02:26:52.597

0 投票

1 回答

42 浏览

r - R qdap 搜索排除语法

我从《华尔街日报》下载的数据中有以下输出。

我想捕获，但由于数据中的位置（如行号）Net Income没有一致性，我尝试使用特别是。它在查找大多数信息方面做得很好，但我对如何删除其他行感到困惑。Net Incomelibrary qdapSearch

我认为这exclude可能会有所帮助，但它似乎不起作用。

我可以Net Income通过其他方式获得，但我更愿意只使用一个功能，即存在Search或任何library qdap可能提供的功能。

任何指导都将受到欢迎。

编辑！！

缩减代码如下，因为运行起来比为其提供数据更容易。该符号与原始符号不同，因此行号将发生变化。

问候斯蒂芬

r regex search qdap

2019-03-02T05:27:30.263

0 投票

0 回答

73 浏览

r - 安装“qdap”包

显示以下错误：

r qdap

2019-03-14T10:59:19.113

0 投票

1 回答

393 浏览

r - 将整洁的文本与同义词结合起来创建数据框

我有如下示例数据框：

我创建了一些整洁的文本如下

此外，我使用qdap包搜索了同义词，如下所示

qdap 输出是一个列表，我希望为整洁的数据框中的每个单词选择前 5 个同义词，并创建一个名为 synonyms 的列，如下所示：

从 qdap 同义词函数合并 5 个单词列表并用逗号分隔的优雅方法是什么？

r tidytext qdap

2019-04-03T11:34:45.977

0 投票

1 回答

32 浏览

r - 如何过滤掉语料库中的所有短字符串（2个和更低的字符）？

给定一个简单的字符串：

我想过滤掉所有 2 和更低长度的子字符串。我怎样才能使用qdap或tm包做到这一点？我知道我可以使用regex它，但是有一个功能可以做到吗？

r nlp tm corpus qdap

2019-06-10T12:31:43.203

0 投票

1 回答

46 浏览

r - qdapRegex::rm_nchar_words 在涉及非英文字母时返回不同的结果？

请帮助我解决以下困惑：

为什么在第一个代码行中它没有以“”响应，但在第二个代码行中它按预期工作。我在这里想念什么？我唯一能想到的是，在第一行代码中，字符串是由非英文字母构建的。

有什么解决办法吗？

r nlp qdap qdapregex

2019-06-11T15:23:19.033

1 2 3 4 5 6 7 8 9 10

问题标签 [qdap]

Reference