我正在研究一个网络数据挖掘项目,通过爬取服务器页面直接从 HTML 中提取信息。我的工作只集中在一个安装了 caucho 树脂的具有 java web 服务器的特定网站上。
参数是通过 url 中的值对传递的,就像 www.xxxxxx.com/jm/search?act=see&id=909&...
我通过 try 解码了许多参数一样,但是当然,结果出来的速度非常慢。
我的问题是......你Java大师知道如何获取这种服务器的所有有效参数吗?有可能的?
我无法访问服务器,我对 caucho 树脂一无所知,我正在用 Java 编写一个实用程序来完成这项工作。