当我使用 FireFox 的“检查元素”功能时,HTML 源文件中没有显示 div 标签。换句话说,我需要的信息是 JavaScript 代码,而不是 HTML 页面源代码。有没有办法将此信息读入R?
我发现了一个类似的问题:如何使用 R 查看网页源代码?
带有建议的代码:
mz <- socketConnection("localhost", "4242")
writeLines("var w=window.open(\"https://google.com\")\n",mz)
out <- readLines(mz) #empty the buffer
writeLines("w.document.getElementsByTagName('html')[0].innerHTML\n", mz)
out <- readLines(mz)
str(out)
但它为我返回 chr(0)。
有人可以提供上述 R 代码的帮助,或提出替代解决方案吗?
谢谢。
已解决:上面的代码以前不起作用,但这是由于没有给页面足够的时间来加载。可能不是解决这个问题的最有效方法,但仍然是一个解决方案。感谢大家