尝试使用 Jsoup 从 Wikipedia 中提取文本时,我得到了这个输出:
我没有足够的代表来发布图片,因为我是这个网站的新手,但它基本上是这样的:
[]{k[]q[]f[]d[]d etc..
这是我的代码的一部分:
public static void scrapeTopic(String url)
{
String html = getUrl("http://www.wikipedia.org/" + url);
Document doc = Jsoup.parse(html);
String contentText = doc.select("*").first().text();
System.out.println(contentText);
}
它似乎获得了所有信息,但格式错误!
感谢您提前提供的任何帮助