我做了一些网络抓取,并有一个字符串 my_html 和我想要的链接
我想要grep()
并尝试过(my_html 的一个例子,它要长得多)
my_html <- 'stuff more stuff ...
<TD ><A CLASS=my_link HREF=\"https://www.stuff.com/secure-bin/my_club/myrep.cgi/tpw9109.cry?scrtpw9109.cry\">
other stuff
<p> www.google.com </p>
end'
my_pattern <- "<TD><A CLASS=my_link HREF=*>"
grep(my_pattern,x=my_html,value=TRUE)
这让我
character(0)
我认为问题与模式中的特殊字符有关,但我不知道补救措施。