我正在使用rvest R包从这个exposed url网页上抓取一个 PDF 文件,但是在我点击by name之后,最终链接被暴露(作为比特流 url - 不管它是什么)AC1-96-21-01-2011.pdf。最终的 pdf 文件隐藏在此处,无法访问。这会阻止所有rvest功能尝试,read_html()因为最终的 pdf 文件仅在单击上一个链接 (on href) 时打开。复制粘贴xml node不允许我输入pdf文件的内容。
<a href="/judgments/handle/123456789/701">Arbitration Case - AC</a>
最终文件位于此 url 上,该 url 未在href节点中公开。
http://judgmenthck.kar.nic.in/judgments/bitstream/123456789/563560/2/AC1-96-21-01-2011.pdf
因此,作为总结,我如何使用上述属性中rvest未找到的 pdf 文件链接访问该链接。href
我试图搜索bitstream,但它把我带到了别的地方。