我正在尝试使用 XPath 抓取网页的特定位置以找到它。该路径似乎是“隐藏的”,因为网页的其他部分很容易到达,但此部分返回一个NULL
值。
我试过使用几个包,但我真的不是这个主题的专家,所以我无法真正评估发生了什么以及是否可以解决它。
这是我尝试过的。
require("XML")
require("scrapeR")
require("httr")
url <- "http://www.claro.com.ar/portal/ar/pc/personas/movil/eq-new/?eq=537"
xp <- '//*[@id="dv_MainContainerEquiposResumen"]/div[1]/h1'
page <- scrape(url)
xpathApply(page[[1]], xp, xmlValue)
# NULL
url.get = GET(url)
xpathSApply(content(url.get), xp)
# NULL
webpage = getURL(url)
doc = htmlTreeParse(webpage, error=function(...){}, useInternalNodes = TRUE)
xpathSApply(doc, xp)
# NULL