我正在使用此代码使用 google 对单词列表进行查询,并从 google 中提取搜索结果的数量。它工作正常,但从昨晚开始,它在执行 200 次查询后一直给我这个错误(我猜是谷歌标记了我!):线程“main”java.io.IOException 中的异常:服务器返回 HTTP 响应代码:503 用于 URL:http ://www.google.com/sorry/?continue=http://www.google.com/ ...
“红色”只是一个例子。
public class Google {
public static void main(String[] args) throws IOException {
String query = "red";
String urlName = "http://www.google.com/search?q=\""+query+"\"";
URL url = new URL(urlName);
URLConnection conn = url.openConnection();
conn.setRequestProperty("User-Agent",
"Mozilla/5.0 (X11; U; Linux x86_64; en-GB; rv:1.8.1.6) Gecko/20070723 Iceweasel/2.0.0.6 (Debian-2.0.0.6-0etch1)");
BufferedReader in = new BufferedReader(new InputStreamReader(conn.getInputStream()));
Pattern pattern = Pattern.compile("<div>About (.*?) results</div>"); //<div>About 1,620,000 results</div>
String line;
while ((line = in.readLine()) != null) {
Matcher m = pattern.matcher(line);
if (m.find()) {
System.out.println(m.group(1)); // m.group(1) coresponds to results number: i.e.: 1,620,000
}
}
in.close();
}
}
任何解决方案,建议?