我正在尝试爬取当地新闻报纸的档案并获得预期的结果。我有什么方法可以对爬虫进行编程,以使每个页面上都相同的静态按钮(例如主页、按钮及其页脚)不包含在爬虫中
这是我用来显示爬取数据的代码
System.out.println(Jsoup.parse(html).body().text_mod());
我正在尝试爬取当地新闻报纸的档案并获得预期的结果。我有什么方法可以对爬虫进行编程,以使每个页面上都相同的静态按钮(例如主页、按钮及其页脚)不包含在爬虫中
这是我用来显示爬取数据的代码
System.out.println(Jsoup.parse(html).body().text_mod());