正则表达式爱好者之一。我有一个格式为字符串的向量:
<TEXTFORMAT LEADING="2"><P ALIGN="LEFT"><FONT FACE="Verdana" STYLE="font-size: 10px" size="10" COLOR="#FF0000" LETTERSPACING="0" KERNING="0">Desired output string containing any symbols</FONT></P></TEXTFORMAT>
我知道用正则表达式解析这类东西的危险。然而,了解如何有效地提取较大字符串匹配的输出子字符串(即>...<
字体标签的角度引号的内容)将很有用。我能做的最好的是:
require(stringr)
strng = str_extract(strng, "<FONT.*FONT>") # select font statement
strng = str_extract(strng, ">.*<") # select inside tags
strng = str_extract(strng, "[^/</>]+") # remove angle quote symbols
在 R 中实现这一目标的最简单公式是什么?