0

我想使用 Boilerpipe 从几个网站的新闻页面中提取文本,问题是每次尝试时,都会出现 ConnectionException 错误。我只是使用了boilerpipe快速入门指南中的示例语法:

URL url = new URL("http://www.telegraph.co.uk/news/health/11523739/Nine-in-10-GPs-say-no-to-seven-day-opening.html");
String text = ArticleExtractor.INSTANCE.getText(url);

这是连接错误:

de.l3s.boilerpipe.BoilerpipeProcessingException: java.net.ConnectException: Connection refused: connect
   at de.l3s.boilerpipe.extractors.ExtractorBase.getText(ExtractorBase.java:89)
   at extract.Test.main(Test.java:14)
Caused by: java.net.ConnectException: Connection refused: connect

我尝试了很多网站,但遇到了同样的错误。

我该如何解决这个问题,或者至少看看问题出在哪里?(也许是防火墙,或端口配置......)

4

1 回答 1

0

经过进一步研究,我发现是企业中的防火墙阻止了这些请求。

于 2015-04-09T13:01:03.707 回答