问题标签 [qdap]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 R 中安装 qdap 包
我一直在尝试在 R 中安装 qdap(注意我使用的是 R 版本 3.3.1)。我已经尝试了几次,安装一直冻结。你知道我有什么可以做的吗?我想使用 qdap 包进行一些拼写检查,如下所示:https ://trinkerrstuff.wordpress.com/2014/09/04/spell-checker-for-r-qdapcheck_spelling/ 谢谢
r - R中包'qdap'中的自定义词
我正在使用 R 中的 qdap 包进行拼写检查。我运行下面的代码并给出这样的输出
这些词是有道理的,但对这些词的更正是无关紧要的。是否有任何选项可以让我们为此功能提供自定义词列表以不过滤?
r - 从字符串向量中仅提取包含 ASCII 字符的单词
我坚持下去,所以,请,欢迎任何建议。
返回一个列表:
但是我想为向量的每个元素创建一个带有这些单词字符串的向量c('hello ringпрг','trust')
,例如"hello ring", "trust"
. 也欢迎任何其他功能和软件包。
java - 在 Rstudio 的 Mac Sierra 上加载“qdap”失败
我正在尝试使用“闪亮”包在 Rstudio 中运行应用程序,但我得到了下面引用的错误。我在这里阅读了帖子,所以我想 rJava 一定有问题?我已经在 Rstudio 中下载了 rJava 包。我 Mac 上的 java 版本是 java 版本 "1.8.0_111" Java(TM) SE Runtime Environment (build 1.8.0_111-b14) Java HotSpot(TM) 64-Bit Server VM (build 25.111-b14, mixed mode)。我是新用户,因此非常感谢任何反馈。先感谢您。这是我尝试运行应用程序时在 Rstudio 中遇到的错误:
监听http://127.0.0.1:7074 加载所需的包:NLP 加载所需的包:qdapDictionaries 加载所需的包:qdapRegex
附加包:'qdapRegex'</p>
以下对象被“package:shiny”屏蔽:
加载所需的包:qdapTools 加载所需的包:RColorBrewer JavaVM:请求的 Java 版本((null))不可用。在 "" 处使用 Java。JavaVM:无法加载 JVM:/bundle/Libraries/libserver.dylib JavaVM 致命:无法加载 jvm 库。错误:'openNLPdata' 的 loadNamespace() 中的 .onLoad 失败,详细信息:调用:.jinit() 错误:JNI_GetCreatedJavaVMs 返回 -1
警告:错误:“qdap”的包或命名空间加载失败堆栈跟踪(最里面的优先):40:库 1:runApp 错误:“qdap”JavaVM 的包或命名空间加载失败:请求的 Java 版本((null))不可用. 在 "" 处使用 Java。JavaVM:无法加载 JVM:/bundle/Libraries/libserver.dylib JavaVM 致命:无法加载 jvm 库。错误:'openNLPdata' 的 loadNamespace() 中的 .onLoad 失败,详细信息:调用:.jinit() 错误:JNI_GetCreatedJavaVMs 返回 -1
警告:错误:“qdap”的包或命名空间加载失败堆栈跟踪(最里面的优先):40:库 1:runApp 错误:“qdap”JavaVM 的包或命名空间加载失败:请求的 Java 版本((null))不可用. 在 "" 处使用 Java。JavaVM:无法加载 JVM:/bundle/Libraries/libserver.dylib JavaVM 致命:无法加载 jvm 库。错误:'openNLPdata' 的 loadNamespace() 中的 .onLoad 失败,详细信息:调用:.jinit() 错误:JNI_GetCreatedJavaVMs 返回 -1
警告:错误:“qdap”的包或命名空间加载失败堆栈跟踪(最里面的优先):40:库 1:runApp 错误:“qdap”的包或命名空间加载失败</p>
r - 使用 lapply 或 for 循环在 R 中为转录创建数据帧列表
我正在尝试创建一个我想要运行文本挖掘分析的所有转录的列表。
我正在使用 qdap 使用以下代码读取转录:
这会生成一个包含两列的数据帧,一列标识说话者,另一列标识对话字符串。
我有很多转录,所以想创建一个列表以进行进一步分析。
我试过这样使用 lapply :
但这会产生以下错误:
我也尝试了一个for循环:
但由于某种原因,这只读取最后一个文件,列表中的所有其他条目都是 NULL。
不知道这里出了什么问题。
r - 将文本中的单词替换为使用 all_words 生成的单词
作为一个新手qdap
,我不确定这个功能是否存在,但如果有下面提到的东西会很棒。
我的初始数据集。
在使用all_words()
时,我最终得到以下数据。
有没有一种方法可以用出现的确切单词替换主数据集all_words()
?
编辑1:所以使用 all_words() 得到的列表应该替换数据框中的原始单词,即 112 mills 应该变成 mills,56mg)_job 应该变成 mgjob。
r - 将字符串值替换为 R 中查找列表中的值
我有一个数据集,其中有一列像
我想替换与替换值匹配的字符串值 id。我现在正在使用以下代码
这在我用来查找案例的另一段代码中
我想更新那些我发现我希望输出像
我不想通过硬编码来做到这一点。我想编写一个可扩展的代码。
非常感谢任何帮助
提前致谢
r - R中的name2sex函数错误?
new
数据集
我应用了:name2sex
此数据集上的函数和错误:
我用了:
但是我的新数据集有 3683 行,而不是 3961。它为描述 a 和 e 提供输出,因为它仅由单个单词组成,而不是整个数据集。我尝试了另一种方式,即
r - 查找术语文档矩阵中所有术语之间的关联 - 巨大的尺寸
我需要找到术语文档矩阵中每个术语之间的相关性。矩阵中的项数为 181841,文档数为 191431。我需要获取每个项与其他项的相关系数。
我使用了一个 for 循环和下面的代码来为每个术语获取它。然后使用 rbind 我将其设为单个数据帧。
编辑 1:下面是一个可重复的小示例。
然而,这需要大量时间来执行。即每学期大约 5 分钟。有没有更好的方法来完成这项工作。
r - 在 qdap 中从拼写检查中省略单词
这是我在 StackOverflow 上的第一篇文章,如果我违反任何规则,我深表歉意。
我正在使用 R 包qdap
对非常混乱的病历文本进行拼写检查。这项工作的目标是识别药物副作用的拼写错误,以建立副作用拼写错误字典。我正在处理的文本包含许多拼写错误、缩写和其他使简单拼写检查变得困难的东西。在我对一张医生的小便条进行拼写检查后,拼写检查程序会返回数百个单词。这使得搜索我关心的副作用拼写错误变得困难。
我尝试使用以下代码创建一个仅包含正确拼写的副作用的字典,这样qdap
会触发严重拼写错误的单词属于该字典。问题在于,几乎文本中的每个单词,无论拼写是否正确,都不会返回为不正确的(即“notable”拼写错误,而“nausea”是我字典中建议的替换)。
这里的术语“字典”是我自己构建的副作用字典,并且check_spelling
正在对包含在 csv 文件中的文本运行。有什么办法可以忽略与字典中包含的单词相距很远的单词不会出现在拼写检查功能中(例如我之前的示例)?这样我可以减少我在 spell_check 输出中看到的单词数量,并且只识别拼写错误的副作用。
作为一个小提示,更改assume.first.correct
为TRUE
不会改变任何内容,因为字典不会以这种方式运行。