问题标签 [stringr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
63 浏览

string - 在 R 中,使用数据帧数据擦除字符串的各个部分

我有一个看起来像这样的数据框:

我有一个字符串,其中包含我想在这些开始/结束偏移对处删除的内容。因此,无论字节偏移量 232 和 234 之间是什么,我都想“擦除它”并折叠空间。我发现我想向后处理字符串,这样如果我在最后修改它,靠近开头的偏移量仍然有效。我到目前为止的代码是:

但是当我之后打印出 sc 时,它只删除了我想要删除的每个子字符串的第一个字符。有谁知道我做错了什么?此外,这可以向量化吗?

更新- 我尝试使用 stringr 的 str_sub:

所以,很明显我不明白我在用 R 中的字符串处理做什么。

0 投票
2 回答
792 浏览

r - 在大数据表中操作字符串的最佳方法

我有一个 67MM 行的 data.table,其中人名和姓氏用空格分隔。我只需要为每个单词创建一个新列。

这是数据的一小部分:

预期产出

第一次尝试

如何进行这项工作将是第一个问题

第二次尝试

这行得通,但我似乎做了 3 次计算。不确定它是否是最有效的方法

让我们使用big_n进行基准测试

0 投票
4 回答
7475 浏览

regex - 提取两个不同模式之间的部分字符串

我尝试使用stringr包来提取字符串的一部分,它位于两个特定模式之间。

例如,我有:

并通过使用str_extract(string, pattern)函数(其中模式由 POSIX 正则表达式定义)我想收到:

谷歌的解决方案不起作用。

0 投票
3 回答
4454 浏览

r - 在r中将街道地址拆分为街道号和街道名称

我想将街道地址拆分为 r 中的街道名称和街道编号。

我的输入数据有一列,例如

我想将街道号码和街道名称分成两个单独的列,以便显示为:

无论如何都可以从R中的因子/字符串中的非数字条目中拆分数值吗?

谢谢

0 投票
3 回答
11742 浏览

string - 将字符向量拆分为单个字符?(与 paste 或 stringr::str_c 相对)

R中一个非常基本的问题,但解决方案尚不清楚。

如何将字符向量拆分为其单个字符,即paste(..., sep='')or的反面stringr::str_c()

任何比这更笨重的东西:

是否可以以其他方式完成,例如使用strsplit()stringr::*其他方式?

0 投票
2 回答
88 浏览

regex - R正则表达式:用更具体的信息替换整个字符串列表

如果我有一个包含诸如"Q7", "Q2"等元素的分类变量的数据,如何将其替换为"7 Queen", "2 Queen"等?

0 投票
2 回答
1133 浏览

regex - stringr 按字母和数字拆分列

我只能使用 stringer/正则表达式,我在 r 工作

我下载了一个名为 mpg2 的 csv,其中的一个子集仅包含 Mercedes Benz 制造的。我想要做的是将模型拆分为字母和数字,以便我可以绘制它们。例如,梅赛德斯 C300 需要拆分为 C 和 300,或者 GLS500 需要拆分为 GLS 和 550。

所以现在我有了所有的型号,现在我想在字母和数字之间进行拆分。

我努力了

但这并没有达到我想要的效果,而且我已经玩过 n= 了,但这也不起作用。然后我有

这使得一列只有数字,我无法让字母工作。如果我需要上传我的特定数据集让我知道,我只需要弄清楚如何做到这一点。

但我需要将“XYZ123”基本上拆分为字母和数字部分,并将它们放在 2 个单独的列中。

0 投票
3 回答
19676 浏览

r - str_replace (package stringr) 不能替换 r 中的括号?

我有一个字符串,说

我想删除字符串中的括号。我决定使用 stringr 包,因为它通常可以处理这类问题。我用 :

但是什么都没有被替换,下面被替换了:

如果我只想替换右半括号,它可以工作:

但是,左半括号不起作用:

并显示以下错误:

任何人都知道为什么会发生这种情况?那么如何删除字符串中的“()”呢?

0 投票
2 回答
68 浏览

r - 使用多个单词重新编码字符串向量

我有以下两个向量:

我想查找 vector1 是否与vector2 中的至少一个单词匹配。结果应该是:

我知道怎么一一做

但必须有一种方法可以同时完成这一切。我知道这是一个简单的问题,但我还没有找到直接解决它的答案。

非常感谢,

0 投票
2 回答
250 浏览

r - 使用 stringr 查找分类中每个单词的计数

我正在尝试将两组单词与字符串数进行匹配。这两组词是 car 和 school,我使用 stringr 包将其设置为匹配来自 car 或 school 的词的任何实例。

太好了,这行得通。

现在,我想回去看看是否可以轻松计算出汽车和学校“桶”中每个单词的频率。

所以它应该如下所示

因为本田在汽车分类中出现一次,所以它的频率计数为1。同样,在学校分类中出现两次的俄亥俄州立大学的频率为两次。

谁能帮我从分类匹配到找到分类中每个单词的频率?

我可能会回去并将 car 中的每个单词设置为它自己的 str_c 并以这种方式匹配,但我想找到一条“更简单”的路线。