我有一个使用 apache 的 HttpClient 来获取网站的应用程序。它有 2 个线程 - UI 线程(用户可以在其中命令下载子页面)和其他线程通过使用 HttpPost 下载每隔 x 秒刷新一次主页。似乎存在一些同步问题(查询开始立即以套接字错误结束),当重新加载用户开始下载另一个页面时(我对两个查询使用相同的 DefaultHttpClient)。重要的是该页面需要 cookie(用户有其会话)。我的问题是:我应该使用一个 HttpClient 和查询队列不让它们同时发生吗?或者也许每个线程都应该有自己的 HttpClient 并且它们应该有共同的上下文?还是有其他方法可以消除此错误?
我还想问你是否知道比 JSoup 更快的 HTML 解析器。我同意,它相当快,但也许有更好的东西?