2

我有大量文本要在各种属性的文本 csv 文件中进行搜索,以查找属性的平方米数值实际是多少。例如:

string <- "This is a wonderful 120 sqm flat with a stunning view"

我知道我可以使用以下方法来提取数值:

sqm <- as.numeric(gsub("\\D", "", string)) 

它应该返回一个数字向量'120'。但是,我想知道是否有更复杂的方法来实现这一点,因为文本中可能存在其他不相关的数值?

有没有办法搜索“平方米”并返回它前面的数字?非常感谢您的任何评论。

4

1 回答 1

2

我相信这个正则表达式前瞻应该可以工作:

library(stringr)
##
string <- "This is a wonderful 120 sqm flat with a stunning view"
re <- "((\\d+)(?=\\s?sqm))"
##
R> str_extract(string, perl(re))
[1] "120"
于 2015-04-29T14:10:43.153 回答