我不确定这是否可行,但我想从使用 Javascript 呈现数据的网页中检索一些数据。这将来自 linux shell。
我现在能做的:
http post 使用 curl/lynx/wget 登录并从命令行获取标题
使用标题进入命令行网页中的“安全”位置
但是,页面上呈现的唯一元素是静态 html。我需要的大部分信息都是用 js 动态呈现的(尽管最终也是 html),并且不会显示在命令行浏览器上。我知道问题在于缺少 js 解释器。
因此......我认为可能的一些解决方法是:
从命令行调用完整的浏览器并以某种方式将信息传递回标准输出。这意味着我必须能够发布。
将我从 curl 获得的标头(带有会话信息等)传递到这些完整浏览器之一,然后再次将输出 html 转储回标准输出。如果一切都失败了,它可能是窗口上的打印屏幕功能。
纯Java解决方案也可以。
有人有做过类似的事情并取得成功的经验吗?
谢谢!