假设我想提取在两个已定义字符串之间找到的字符串。例如,我们将调用它的函数parse_between()
在 R 中的工作方式如下:
>main_string<-"the quick brown fox>$ jumps over the lazy </ dog"
>substring<-parse_between(main_string, begin=">$", end="</")
>substring
[1] " jumps over the lazy "
如果它可以生成一个包含与每个实例对应的元素的向量,那就更好了。我搜索了一些可用于字符串操作的包,如“stringr”,但没有找到像示例所示那样轻松执行此操作的函数。不幸的是,尽管搜索了我还没有找到 R 的 html 解析器,但我的动机是解析 html 文件。