问题标签 [stringr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
227 浏览

r - stringr 是否替换了 base-R 的字符串操作函数?

我即将开始学习更多关于 R 中的字符串操作的知识。总的来说,我非常喜欢 Hadley Wickham 的包,因为它们倾向于使 R 中的编程变得更加容易。话虽如此,是否stringr替换了所有 Base-R 的字符串操作函数?含义 - 有什么我不能stringr在 Base-R 中做的事情吗?如果有,这些是什么?

0 投票
3 回答
223 浏览

regex - 在 R 中使用正则表达式提取位置数据

R新手在这里我有看起来像这样的数据:

我想从此文本中提取位置数据:加利福尼亚州圣地亚哥。

我一直在尝试使用这个 stringr 包来实现这一点,但不能完全获得正则表达式来捕获城市和州。有时状态会存在,有时不存在。

0 投票
2 回答
63 浏览

regex - 用于数字计数 R-lang 的 Perl 正则表达式

我正在使用 R 和 New 来正则表达式:我需要一个正则表达式来提取 'statuses_count' 以获得类似 json 的文本。数据被组织成一个数据框,每一行都有文本。样本数据行:

结果应该是:4414。

我正在考虑将 str_extract_all 与 perl 选项一起使用,但我不明白如何仅获取 'statuses_count' (?<=statuses_count.:)(something) 后面的数字

作为一个新手,很高兴能理解如何说“抓住 'statusescount' 之后的数字。” 谢谢!

0 投票
1 回答
947 浏览

r - 如何用一个单词替换数据框列中的多个单词?

我正在尝试清理一个数据库,其中的因素已经用不同的词进行了估算,但含义相同。

例如:从“Purring cat with tail, 4 leg and fur”“European tabby cat”“Cat CAT cat”“Cat”

我研究gsub了命令和stringr命令的类型,但无法实现我的目标。

有什么建议吗?

编辑:抱歉不清楚,这是我的第一篇文章。

我想用一个替换几个词。如果“猫”出现在条目中的任何位置,我希望将整个条目重命名为“猫”。到目前为止,我只能用其他东西替换条目的某些部分,但不能删除多余的单词。

0 投票
1 回答
75 浏览

regex - 提取以特定数字开头的字符串

我想提取所有以零开头的数字 - 例如"00000019649216698073892337728035449839" ,使用以下字符向量将其提取到一个新变量中:

什么是合适的正则表达式,有人可以建议一个简单易懂的资源,其中包含大量示例来理解正则表达式吗?

谢谢

0 投票
0 回答
95 浏览

r - 字符串空格 ggplot2

我正在尝试使用 ggplot2 创建一个森林图。

在此处输入图像描述

在我的 y 轴文本中,我希望空格后的所有数字都左对齐。这是行不通的。

我知道字符串对齐:

我能做些什么来完成这项工作吗?

0 投票
1 回答
115 浏览

r - 如何使用 plyr/dplyr 从现有变量中更快地创建上下年龄变量

我有一些“untidy”格式的数据——变量名中嵌入了“age”。使用 dplyr,我想创建一个“整洁”格式的数据集,其中键是数据区、年份和年龄组,并且年龄组内的较低和较高年龄是单独的变量。

所有这一切都很好,除了最后一步比我想要的要长得多。有没有更快的方法来做到这一点仍然是“可读的”?

完整的可重现示例(repmis用于拉取文件)

显然,我在 mutate 中创建了两次相同的对象,因此有可能使速度翻倍。我还认为 group_by 意味着每个年龄组只需完成一次操作,但它似乎对每一行都进行。例如,按年龄组总结、变异然后加入是一种更快的方法吗?

编辑

上面的代码已经创建了输出,但比我想要的要慢得多。

最终输出的几个示例:

0 投票
2 回答
2298 浏览

r - 替换 R 中的字符串,给出模式向量和替换向量

给定一个我想替换的具有不同占位符的字符串,R 是否有一个函数可以在给定模式向量和替换向量的情况下替换所有这些占位符?

我已经设法通过一个列表和一个循环来实现这一点

有一个类似的问题R:gsub,模式=向量和替换=向量但它要求仅用一种模式替换不同的字符串。在这里,我正在寻找替换单个字符串中的所有模式。

我努力了

显然输出不是我想要的(几个输出字符串,每个只有一个替换)。

我想知道一个函数是否存在于 base 或一个众所周知的 CRAN 包中,它会像前面显示的那样被调用,并且能够在单个字符串中进行所有替换。

有人对我的循环有更好的解决方案或建议,还是应该将其转换为函数?

[注意] 字符串可以是小型网页模板,o 配置文件。它们很小,因此循环进行 10 或 20 次替换并不是什么大问题,但我正在寻找更优雅的解决方案。

0 投票
4 回答
13290 浏览

regex - 使用 stringr 从 R 中的系列中提取最后 4 位数字

我想展平从 HTML 表中提取的列表。下面给出了一个最小的工作示例。该示例取决于stringrR 中的包。第一个示例展示了所需的行为。

当我尝试匹配一系列其他数字中的最后 4 位数字时,下面的示例会产生不希望的结果。

据我了解文档,我应该$在模式的末尾包含,以便在字符串的末尾请求匹配。我更愿意匹配第二个示例中的数字“2005”、“2003”和“1996”。

0 投票
2 回答
164 浏览

regex - splitting a string in which upper case follows lower case in stringr

I have a string vector that looks like this and I'd like to split it up:

But I need to keep those letters at the end and start of the words.