我正在尝试设置一个小型 Android 应用程序,该应用程序使用 Goose 库从网页中提取内容。由于该库是用 Scala 编写的,因此我使用的是在此处找到的 .jar 。问题是,当我尝试从页面中提取内容时,它什么也没有返回。我使用所需的 URL 成功创建了一个Article
对象,但对象的值(标题、域、topImage 等)都是null
. 我尝试使用不同的网址,以查看问题是否与单个网站有关,但似乎并非如此。
我用来设置Goose
实例的代码是这样的:
gooseDir = context.getCacheDir();
Configuration config = new Configuration();
config.setLocalStoragePath(gooseDir.getAbsolutePath());
Goose goose = new Goose(config);
然后我Article
像这样创建实例:
Article article = goose.extractContent(url);
有什么建议吗?