问题标签 [stringi]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
805 浏览

r - R中正则表达式的问题:匹配由空格或字符串开头/结尾包围的单词

我想计算字典中出现在字符串中的单词的数量,如果它被空格包围或者它位于字符串的开头或结尾。

我正在使用这样的答案:

哪个返回3 1 0 1 1 0 0,但我期待3 1 0 0 0 0 0。所以问题是它也很重要"dutchAA"而且"AAbrown"我不想要。

我对此有点困惑,因为当我在RegExr上运行这个正则表达式时它工作得很好。

0 投票
1 回答
1050 浏览

html - 将 HTML 实体转换为正确的字符 R

有谁知道 r 中可以转换ä为其 unicode 字符的通用函数â?我已经看到了一些接受â并将其转换为普通字符的函数。任何帮助,将不胜感激。谢谢。

编辑:下面是数据记录,我可能有超过 100 万条记录。除了将数据读入海量向量并为每个元素更改记录之外,还有更简单的解决方案吗?

更新:使用函数 stri_trans_general 函数会将 any 转换Â为正确的小写字符,并且需要分配 vapply 结果以保存更改。

0 投票
2 回答
5385 浏览

r - 在 R 中安装 stringi 库时出现 icudt 错误

我写这篇文章是因为我花了好几天才得出这个结果。

底线:stringi 库版本 1.1.3(2017 年 3 月发布)可能存在涉及 icudt 的问题。您可以使用以下命令安装 stringi 1.1.2:

我从一些关于如何安装旧包的RStudio 文档中将这些放在一起。

背景:

我试图在 R 中安装预测库。最初,我使用的是 R 3.1.2。我还安装了 R 3.3.3 并尝试安装它。我正在运行 CentOS 6.7 并且没有升级的选择。

由于安装 stringi 的问题,无法安装 Forecast。由于下载 ICU 数据库 (icudt) 时出错,stringi 库安装失败 看起来 stringi 1.1.3 添加了有关 icudt 的下载/构建逻辑,而即将发布的 1.1.4 版本对此逻辑进行了更正(截至日期 2017-04- 02)。

我去了 ICU 项目站点:并下载/安装了似乎在以下错误消息中指定的 ICU 库:

在线搜索 icu55、icudt55l.zip 或任何解决此错误的过程都没有找到有效的过程。我下载、构建并安装了 ICU 55.1 和 ICU 58.2。我还更新了 gcc 和 g++。stringi 1.1.3 的 CRAN 存储库安装说明目前没有提供一套简单的说明来在我有工作的 Internet 连接时成功安装 stringi。

我首先提出这个问题,然后找到了我的答案。无论如何我都会发布它。我添加了几个链接,但需要删除它们,因为我没有足够的信誉来摆脱它们。

0 投票
0 回答
1048 浏览

r - 安装 readtext 包

我无法安装 readtext 包,我尝试了两种方法:

  1. 尝试“install.packages (readtext)”时,会显示一条消息,指出这不适用于 R 版本 3.3.3

  2. 当尝试通过 devtools 从 github 安装它时,它会显示以下消息:

错误:依赖项 'stringi' 不适用于包 'readtext' * 从我的库中删除 [readtext] 错误:命令失败 (1)

这很奇怪,因为安装了 stringr 包......

谢谢

0 投票
0 回答
245 浏览

r - R中的string_count和正则表达式

我想使用 stringi 包中的 str_count 来计算字符串中的特殊符号。

像这样的东西:

我收到以下错误。

有任何想法吗?

0 投票
1 回答
2038 浏览

r - 在 R 中将 ASCII 转换为 UTF-8 stringi

我有以下问题:

然后我尝试:

但这仍然行不通。也许有人可以建议如何使这两个字符串相同(我正在尝试将 x_1 与 x_2 合并)。

0 投票
1 回答
24070 浏览

r - 使用 filter() 和 str_detect() 按多个模式过滤

我想使用 filter() 和 str_detect() 匹配多个模式来过滤数据帧,而不需要多个 str_detect() 函数调用。在下面的示例中,我想过滤数据框df以仅显示包含字母a f和的行o

我尝试了以下

并收到以下错误

警告消息:在 stri_detect_regex(string, pattern, opts_regex = opts(pattern)) 中:较长的对象长度不是较短对象长度的倍数

0 投票
0 回答
46 浏览

r - 根据关键字向量过滤文本列

这是dput()信息

我想filter根据vector.

这是我迄今为止尝试过的,但不明白为什么它仍然会带来另一个text没有匹配的:

如您所见,它带来了be more customer focused reduce prices and offer same deas to existing customers that they use to attract new ones其中没有任何关联关键字的phrase

0 投票
0 回答
94 浏览

r - R:正则表达式 "\\b"%s+%c("character","...")%s+%"\\b" 是如何工作的?

我一直在寻找替换多种模式的选项,并在下面的第一个链接中找到了一些答案。建议的答案之一使用stringr包。我有兴趣检查选项stringi并在文档中找到一个(第二个链接的最后一个示例),它是:

有人可以解释一下%s+%这里的工作原理。我知道要使用的选项%,请参阅下面链接 3 中提到的相关问题。但是,我无法弄清楚这种特定语法是如何工作的。这是否与管道、格式(例如 in sprintf)或空格正则表达式有关?有人可以解释一下这是如何工作的,或者指向我可以通知自己的资源吗?我不确定元主题是什么,所以我不知道在哪里看,例如,正则表达式手册?抱歉,如果这很简单,结果证明我刚刚应用了错误的搜索策略。谢谢你。

我的问题与以下链接有关:

1:https://stackoverflow.com/questions/19424709/r-gsub-pattern-vector-and-replacement-vector

2:http://www.gagolewski.com/software/stringi/manual/?manpage=stri_replace

3:https://stackoverflow.com/questions/12730629/what-do-the-op-operators-in-mean-in-r-for-example-in

0 投票
0 回答
524 浏览

r - 安装 R 包 stringi 时出错

stringi在 R 库安装期间安装包时出现问题。

在安装包的过程中,当我连接到 URL 并收到“icudt551.zip”时出现错误。但是,目前的情况是,如果你的Linux“/home/R”路径下有“icudt551.zip”文件,并且无法连接到互联网,则需要安装它。

我需要有关如何继续安装的帮助。这是我使用的命令。