3

我正在尝试在 R 中隔离字符串的一部分。这些字符串具有格式 ABC_constantStuff_ABC_randomStuff,并且ABC是我要提取的内容。ABC是未知的,可以是 1-3 个字符长。我一直在尝试grepgsub但不确定如何使用指定我的正则表达式

str <- 'GDP\" title=\"GDP - News\"></a>"'
symbol <- gsub(pattern,'',str)

这里GDP是未知的,可以是 1-3 个字符长,\" title=\"在每个字符串中都是恒定的,我想删除\" title=\"GDP - News\"></a>"

提前感谢您的帮助。

4

2 回答 2

4

一个简单的就是

R> gsub("^([A-Z]*)_.*", "\\1", "ABC_constantStuff_ABC_randomStuff")
[1] "ABC"
R> 

它将所有字母都放在第一个_

另一个假设_是你的分隔符是

R> strsplit( "ABC_constantStuff_ABC_randomStuff", "_")[[1]][c(1,3)]
[1] "ABC" "ABC"
R> 
于 2013-02-08T15:00:45.240 回答
3

这有帮助吗?

> sub("\".*$", "", str)
于 2013-02-08T14:59:44.647 回答