r - 使用 rvest 收集数据不会从数据小部件中检索任何值

Question

我正在尝试使用rvest（也尝试使用XMLand selectr）来收集数据，但我遇到了以下问题：

在我的浏览器的网络检查器中，html 看起来像

<span data-widget="turboBinary_tradologic1_rate" class="widgetPlaceholder widgetRate rate-down">1226.45</span>

（注意：rate-down并且1226.45会定期更新。）我想收获，1226.45但是当我运行我的代码（如下）时，它说那里没有存储任何信息。这与它是一个小部件这一事实有关吗？任何有关如何进行的建议将不胜感激。

library(rvest);library(selectr);library(XML)
zoom.turbo.url <- "https://www.zoomtrader.com/trade-now?game=turbo"
zoom.turbo <- read_html(zoom.turbo.url)
# Navigate to node
zoom.turbo <- zoom.turbo %>% html_nodes("span") %>% `[[`(90)

# No value
as.character(zoom.turbo)
html_text(zoom.turbo)  

# Using XML and Selectr
doc <- htmlParse(zoom.turbo, asText = TRUE)
xmlValue(querySelector(doc, 'span'))

score 1 · Accepted Answer

对于难以抓取的网站，例如内容是动态的，您可以使用RSelenium. 使用此包和浏览器 docker，您可以使用 R 命令浏览网站。

我已经使用这种方法来抓取具有动态登录脚本的网站，而我无法使用其他方法。

r - 使用 rvest 收集数据不会从数据小部件中检索任何值

1 回答 1

Related

Reference