问题标签 [strsplit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - R从字符串中提取第一个数字
我在一个变量中有一个字符串,我们称之为 v1。该字符串表示图片编号并采用“Pic 27 + 28”的形式。我想提取第一个数字并将其存储在一个名为 item 的新变量中。
我尝试过的一些代码是:
这工作得很好,直到我找到一个清单:
在这一点上,我得到了比我想要的更多的数字,因为它还获取了其他唯一的数字(25)。
我实际上已经尝试过用 gsub 来做这件事,但没有任何工作。帮助将不胜感激!
regex - 在R中的模式/分隔符之间提取字符串
我有以下形式的变量名:
或者
我正在尝试使用字符串拆分来查找中间部分:即Sample_12
或Sample-17
. 但是,当我这样做时:
我结束了Sample
for PP_Sample_12.GT
。
还有另一种方法可以做到这一点吗?也许使用模式/替换功能?虽然,不确定这是否存在于 R 中(但我认为这可能适用于gsub
)
r - 使用 strsplit 拆分字符串并为拆分的一部分创建一个新向量
我有一个矩阵,其列名都是“BT549-[数字]”,所以 BT549-0、BT549-1 等。我正在尝试删除 BT549- 前缀并只保留数字。到目前为止,在连字符上拆分名称效果很好,但事实证明删除字符串更加困难。例如,如果矩阵命名为 dset,
我尝试使用 for 循环拆分字符串并保留每个字符串的第二个索引:
但我不明白这个错误。我怀疑有一种简单的方法可以做到这一点,我只是没有想到。非常感谢任何和所有建议。谢谢。
r - R将列拆分为2而不更改其他列
我有我的意见。我正在使用 R。我想要 R 中的解决方案
我要输出
我试过了
但第三列被遗漏了。即使在这种情况下我有多个列,我将如何工作
regex - 删除 r 中 str_split 中的左括号
我怎样才能在 R 中完成这项工作?
gregexpr("(", "US (California, San Luis Obispo County)", fixed = FALSE, : invalid regular expression '(', reason 'Missing ')'' 中的错误
gregexpr("(", "US (California, San Luis Obispo County)") 中的错误:无效的正则表达式 '(',原因 'Missing ')''
gregexpr("(", "US (California, San Luis Obispo County)", perl = T) 中的错误:无效的正则表达式 '('
此外,警告信息:
r - cbind 列表列表的第 i 个名称到第 i 个列表
(请随意将标题更改为更合适的名称)
我有一个类似下面的列表。我想要做的是将cbind
每个names
嵌套列表中的每一个添加到该列表中的一个新列。另外,我希望strsplit
每个names
by/
所以实际上cbind
是两列,即 Nrep=rep1 和 sp=sp1,每列的行数与嵌套列表本身的行数相同。
我的想法是尝试分两步完成;提取names
+strsplit
然后将cbind
每个提取到正确的嵌套列表中,产生如下所示的输出。但是,我无法理解如何进行最后一步。
期望的输出
任何关于此的指针将不胜感激,谢谢!
r - 如何将列表(strsplit输出)转换为R中的逻辑数据框(根据列名)
这是我的第一篇文章,显然我没有编程经验。
问题:
我有一个包含 200 个字符向量的列表,每个字符向量的范围从 0 到 7 个元素:(这个列表是 strsplit 函数的输出)。
我在输入中还有一个包含所有潜在字符串的字符串:
我想将其转换为以下格式的数据框(或完成工作的类似对象):
我非常广泛地尝试对其进行转换,我得到的最远的是一个数据框,其中包含所有可能的字符串作为列名,所有行中都有字符串,并填充有 NA(我在此过程中使用了 rbind.fill)。
任何帮助将不胜感激,
谢谢!
r - R中的拆分字符串
我正在尝试从 Linux 拆分“ls -lrt”命令的输出。但它只占用一个空格作为分隔符。如果有两个空格,那么它将第二个空格作为值。所以我认为我需要将多个空间压制为一个。有人对此有任何想法吗?
在下一步中,我只需要文件名,我使用了以下代码,效果很好:
r - Extract string elements that possibly appear multiple times, or not at all
Start with a character vector of URLs. The goal is to end up with only the name of the company, meaning a column with only "test"
, "example"
and "sample"
in the example below.
Remove the ".com"
and whatever might follow it and keep the first part:
My next step is to remove the http://
and https://
portions with a chained gsub()
call:
But here is where I need help. How do I handle the multiple periods (dots) before the company name in the first and third strings of urls? For example, the call below returns NA for the second string, since the "example"
string has no period remaining. Or if I retain only the first part, I lose a company name.
Perhaps an ifelse()
call that counts the number of periods remaining and only uses strsplit if there is more than one period? Also note that it is possible there are two or more periods before the company name. I don't know how to do lookarounds, which might solve my problem. But this didn't
Thank you for any suggestions.