我正在尝试用 Java 抓取网页,我需要在页面中搜索 URL 和文件路径,这可能是相对的,也可能是绝对的。(例如 ../../file.gif 或http://hostname.com/file.gif)。并非所有这些都会有 html 标签<a href>
,因为某些文件路径可能嵌入在某些 javascript 中。
如果有人能指出我正确的方向,那就太好了。
我正在尝试用 Java 抓取网页,我需要在页面中搜索 URL 和文件路径,这可能是相对的,也可能是绝对的。(例如 ../../file.gif 或http://hostname.com/file.gif)。并非所有这些都会有 html 标签<a href>
,因为某些文件路径可能嵌入在某些 javascript 中。
如果有人能指出我正确的方向,那就太好了。