问题标签 [qdap]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 用R中的英文单词替换年份
我需要预处理语音记录以进行强制对齐。但是,我很难用文本表示替换年份。比如1984就需要换成“十九八十四”。我尝试了 qdap 包的 replace_number 功能。这个包很棒,但是它用“一千九百八十四”代替了1984。我可以尝试来自任何 R 包的其他功能吗?谢谢!
r - 在 R 中安装 rJava 或 qdap 的问题
尝试安装 qdap 或 rJava 时,总是返回 image not found 错误
库(rJava)错误:'rJava'的包或命名空间加载失败:'rJava'的loadNamespace()中的.onLoad失败,详细信息:调用:dyn.load(文件,DLLpath = DLLpath,...)错误:无法加载共享对象'/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rJava/libs/rJava.so':dlopen(/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rJava /libs/rJava.so, 6):库未加载:@rpath/libjvm.dylib 引用自:/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rJava/libs/rJava.so 原因:图像未找到 Blockquote
我遵循了这个早期线程上的每条指令,仍然不起作用,同样的错误消息。
R 版本 3.4.0 (2017-04-21) 平台:x86_64-apple-darwin15.6.0 (64-bit) 运行于:OS X El Capitan 10.11.6
矩阵产品:默认 BLAS:/System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib LAPACK:/Library/Frameworks/R.framework/Versions/3.4/Resources /lib/libRlapack.dylib
r - 您可以在没有导入或依赖项的情况下在 R 中安装包吗?
我在无法访问 Internet 的计算机上工作。我下载了我所有的 R 包并从 .zip 文件中安装它们。然而,一个问题是,当我安装一个包时,它将需要其他包,因为我将它们加载到库中。
例如,我下载了 QDAP,它说“在您下载并安装 rJava 之前无法加载”。使用几个不同的包多次发生这种情况。有没有办法避免这种情况?我不需要“wordcloud 包,但它要求我在使用 QDAP 之前安装它。
r - 使用 R QDAP:无法分配内存
我尝试在 QDAP 中使用各种函数,例如 word_cor、word_associate 等,但我不断收到一条错误消息,上面写着“无法分配 1.5gb 的向量内存”(类似于这些行)。
但是,我不需要该函数来返回 word_cor(等)的所有结果,即使相关性为 0.7。我只想要前50名左右。
我可以/应该在 dpylr 中使用 top_n 函数,还是有另一种方法可以显着降低回报?我研究过稀疏矩阵,但我认为这不是我需要的。
r - dplyr 过滤器使用 qdap::which_misspelt 或 dplyr 过滤器与嵌套函数
一个小数据框:
如果我使用qdap::which_misspelled
,我可以找出拼写错误的单词:
但我想做的是在包含拼写错误的行上对单词 df 进行子集化。以上返回索引 1 和 8 引用我的 df 中提供的所有单词,无论哪一行。
如何根据包含拼写错误的任何行对我的 df 进行子集化?
(如果可以使用 dplyr 过滤器完成,则奖励)
r - 基于频率表的子集/过滤器
我有一个带有一些文本数据的df,例如
我已经能够根据包含拼写错误的任何行进行子集化:
但鉴于我有很多文本数据,我只想过滤更频繁发生的拼写错误:
所以我现在知道“qhick”是一个常见的拼写错误。
然后我怎么能根据这张表子集单词呢?所以只返回包含“qhick”的行?
r - 将单词添加到 R 中的 qdap 字典
我正在使用 qdap 包进行拼写检查,但默认字典没有很多单词,例如城市、州、国家或语言。我知道我可以将单词添加到字典中,如下所示
但我想知道是否有更有效的方法可以将大约 1000 个单词添加到字典中。
谢谢