问题标签 [strsplit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
19355 浏览

regex - R从字符串中提取第一个数字

我在一个变量中有一个字符串,我们称之为 v1。该字符串表示图片编号并采用“Pic 27 + 28”的形式。我想提取第一个数字并将其存储在一个名为 item 的新变量中。

我尝试过的一些代码是:

这工作得很好,直到我找到一个清单:

在这一点上,我得到了比我想要的更多的数字,因为它还获取了其他唯一的数字(25)。

我实际上已经尝试过用 gsub 来做这件事,但没有任何工作。帮助将不胜感激!

0 投票
4 回答
6123 浏览

regex - 在R中的模式/分隔符之间提取字符串

我有以下形式的变量名:

或者

我正在尝试使用字符串拆分来查找中间部分:即Sample_12Sample-17. 但是,当我这样做时:

我结束了Samplefor PP_Sample_12.GT

还有另一种方法可以做到这一点吗?也许使用模式/替换功能?虽然,不确定这是否存在于 R 中(但我认为这可能适用于gsub

0 投票
2 回答
1621 浏览

r - 使用 strsplit 拆分字符串并为拆分的一部分创建一个新向量

我有一个矩阵,其列名都是“BT549-[数字]”,所以 BT549-0、BT549-1 等。我正在尝试删除 BT549- 前缀并只保留数字。到目前为止,在连字符上拆分名称效果很好,但事实证明删除字符串更加困难。例如,如果矩阵命名为 dset,

我尝试使用 for 循环拆分字符串并保留每个字符串的第二个索引:

但我不明白这个错误。我怀疑有一种简单的方法可以做到这一点,我只是没有想到。非常感谢任何和所有建议。谢谢。

0 投票
1 回答
145 浏览

r - R将列拆分为2而不更改其他列

我有我的意见。我正在使用 R。我想要 R 中的解决方案

我要输出

我试过了

但第三列被遗漏了。即使在这种情况下我有多个列,我将如何工作

0 投票
1 回答
249 浏览

regex - strsplit 与 gregexpr 不一致

对我对这个问题的回答的评论应该给出预期的结果strsplit,即使它似乎正确匹配字符向量中的第一个和最后一个逗号。这可以使用gregexpr和来证明regmatches

那么为什么strsplit在这个例子中对每个逗号进行拆分,即使只为同一个regmatches正则表达式返回两个匹配项?


咦?!到底是怎么回事?

0 投票
2 回答
3911 浏览

regex - 删除 r 中 str_split 中的左括号

我怎样才能在 R 中完成这项工作?

gregexpr("(", "US (California, San Luis Obispo County)", fixed = FALSE, : invalid regular expression '(', reason 'Missing ')'' 中的错误

gregexpr("(", "US (California, San Luis Obispo County)") 中的错误:无效的正则表达式 '(',原因 'Missing ')''

gregexpr("(", "US (California, San Luis Obispo County)", perl = T) 中的错误:无效的正则表达式 '('

此外,警告信息:

0 投票
1 回答
175 浏览

r - cbind 列表列表的第 i 个名称到第 i 个列表

(请随意将标题更改为更合适的名称)

我有一个类似下面的列表。我想要做的是将cbind每个names嵌套列表中的每一个添加到该列表中的一个新列。另外,我希望strsplit每个namesby/所以实际上cbind是两列,即 Nrep=rep1 和 sp=sp1,每列的行数与嵌套列表本身的行数相同。

我的想法是尝试分两步完成;提取names+strsplit然后将cbind每个提取到正确的嵌套列表中,产生如下所示的输出。但是,我无法理解如何进行最后一步。

期望的输出

任何关于此的指针将不胜感激,谢谢!

0 投票
1 回答
721 浏览

r - 如何将列表(strsplit输出)转换为R中的逻辑数据框(根据列名)

这是我的第一篇文章,显然我没有编程经验。

问题:

我有一个包含 200 个字符向量的列表,每个字符向量的范围从 0 到 7 个元素:(这个列表是 strsplit 函数的输出)。

我在输入中还有一个包含所有潜在字符串的字符串:

我想将其转换为以下格式的数据框(或完成工作的类似对象):

我非常广泛地尝试对其进行转换,我得到的最远的是一个数据框,其中包含所有可能的字符串作为列名,所有行中都有字符串,并填充有 NA(我在此过程中使用了 rbind.fill)。

任何帮助将不胜感激,

谢谢!

0 投票
2 回答
345 浏览

r - R中的拆分字符串

我正在尝试从 Linux 拆分“ls -lrt”命令的输出。但它只占用一个空格作为分隔符。如果有两个空格,那么它将第二个空格作为值。所以我认为我需要将多个空间压制为一个。有人对此有任何想法吗?

在下一步中,我只需要文件名,我使用了以下代码,效果很好:

0 投票
7 回答
1838 浏览

r - Extract string elements that possibly appear multiple times, or not at all

Start with a character vector of URLs. The goal is to end up with only the name of the company, meaning a column with only "test", "example" and "sample" in the example below.

Remove the ".com" and whatever might follow it and keep the first part:

My next step is to remove the http:// and https:// portions with a chained gsub() call:

But here is where I need help. How do I handle the multiple periods (dots) before the company name in the first and third strings of urls? For example, the call below returns NA for the second string, since the "example" string has no period remaining. Or if I retain only the first part, I lose a company name.

Perhaps an ifelse() call that counts the number of periods remaining and only uses strsplit if there is more than one period? Also note that it is possible there are two or more periods before the company name. I don't know how to do lookarounds, which might solve my problem. But this didn't

Thank you for any suggestions.