1

我正在尝试设置一个小型 Android 应用程序,该应用程序使用 Goose 库从网页中提取内容。由于该库是用 Scala 编写的,因此我使用的是在此处找到的 .jar 。问题是,当我尝试从页面中提取内容时,它什么也没有返回。我使用所需的 URL 成功创建了一个Article对象,但对象的值(标题、域、topImage 等)都是null. 我尝试使用不同的网址,以查看问题是否与单个网站有关,但似乎并非如此。

我用来设置Goose实例的代码是这样的:

gooseDir = context.getCacheDir();
Configuration config = new Configuration();
config.setLocalStoragePath(gooseDir.getAbsolutePath());
Goose goose = new Goose(config);

然后我Article像这样创建实例:

Article article = goose.extractContent(url);

有什么建议吗?

4

1 回答 1

1

由于不兼容,实际上你不能在 Android 上使用 Goose 库,但你可以使用我的 Android 版本:https ://github.com/milosmns/goose

它的功能与 Goose 几乎相同,仅在 Android 上运行良好。

于 2016-09-05T09:22:30.627 回答