我正在使用 Selenium 2 Java API 与网页交互。我的问题是:如何检测链接目标的内容类型?
基本上,这就是背景:在单击链接之前,我想确保响应是 HTML 文件。如果没有,我需要以另一种方式处理它。因此,假设有一个 PDF 文件的下载链接。应用程序应该直接读取该 URL 的内容,而不是在浏览器中打开它。
目标是让应用程序自动知道当前位置是 HTML、PDF、XML 还是其他任何内容,以使用适当的解析器从文档中提取有用信息。
更新
增加赏金:将奖励给允许我获取给定 URL 的内容类型的最佳解决方案。