0

我试图弄清楚如何在远程应用程序或服务器上找出 URL 的基础。例如,网址可以是: http ://www.server.com/app/something/else/page.html

现在绝对基础可以是 www.server.com、www.server.com/app 或任何小于 page.html 的内容。基础取决于应用程序在 web.xml 中的配置方式以及它是否通过例如 apache 代理。

我需要知道这些信息,因为我正在以客户端的身份阅读 url 内容,并且我需要知道如何处理从页面中找到的各种相关内容。

任何提示将不胜感激...

4

1 回答 1

1

作为客户端,这是不可能确定的,因为您对服务器的唯一了解就是 URL,服务器可以在内部以多种方式配置,与返回给您的请求的 HTML 内容无关。

如果您需要像浏览器一样抓取网站,您应该遵循与遇到相对链接时相同的规则。作为客户端,您不能假设服务器没有告诉您的服务器的任何事情。

于 2012-06-02T22:47:41.887 回答