问题标签 [boilerpipe]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
210 浏览

java - 带有谷歌appengine的python锅炉得到导入错误?

我正在尝试使用谷歌应用程序引擎来解决 python 锅炉。我已经在我的本地机器上安装了锅炉管,它工作正常。

使用安装的锅炉管pip

github链接

示例程序适用于给定的 url

试验一:

但是当我使用 google_appengine 运行时,相同的代码会生成ImportError

试验 2

dist_packages然后经过一些研究,我将模块从项目目录中复制了出来。现在我得到_jpype module not found

试验 3

这次我下载了软件包并尝试在项目目录中构建和安装。锅炉管安装无误。但是jpype给出错误jni.h no such file or directory

如何解决导入错误?当相同的代码在本地机器上正常工作时,google_appengine 有什么问题?

0 投票
1 回答
1483 浏览

python-3.x - 我如何设置“没有设置 JAVA_HOME 环境变量。试图猜测它......”?

我正在尝试安装 python 库(boilerpipe):pip installboilerpipe。但我收到错误消息:“没有设置 JAVA_HOME 环境变量。试图猜测它......”这是我已经设置了 java 路径。那我该怎么办????

0 投票
0 回答
564 浏览

python-3.x - 如何从 python33 安装 jpype1(来自锅炉管)库?

我正在尝试安装python库boilerpipe,即

但我收到错误,即

那么我该怎么办这个错误?

0 投票
1 回答
664 浏览

java - 在 Android 应用程序上使用锅炉管

我正在尝试在 Android 应用程序中使用锅炉管。我在 libs 文件夹中包含了boilerpipe-1.2.0、nekohtml-1.9.13、xerces-2.9.1 库。使用 Eclipse 运行应用程序时出现以下错误:Conversion to Dalvik format failed with error 1

它不会给我代码中的错误。我也在 Java 项目中使用相同的代码并且它可以工作。会不会是依赖关系引起的冲突问题?

0 投票
0 回答
179 浏览

java - Android 中使用的 Boilerpipe 导致错误:转换为 Dalvik 格式失败

我把'boilerpipe-1.2.0-android.jar'(https://code.google.com/p/boilerpipe/issues/detail?id=57),

'nekohtml-1.9.13.jar'、'xerces-2.9.1.jar' 到我的 Android 项目的 libs 文件夹中。

但它导致“转换为 Dalvik 格式失败”错误。

所以,我做了所有我找到该错误的解决方案,但我无法修复它。

我想使用boilerpipe来提取元数据、图像Url、文本。请帮我。

并且如果您知道 Android 的文章提取器 API(比锅炉管更好),请告诉我

0 投票
2 回答
2594 浏览

html-parsing - 如何使用 Tika 从 html 中提取主要文本

我只想知道如何使用 Tika 从 html 中提取正文和纯文本?

也许一种可能的解决方案是使用 BoilerPipeContentHandler 但你有一些示例/演示代码来展示它吗?

首先十分感谢

0 投票
2 回答
1213 浏览

html - 类似于 python3 的锅炉管

我需要一个通用工具,从 HTML 文档中提取内容。对于 python2,通常推荐使用锅炉管道。

python3有没有类似的替代品?

0 投票
1 回答
339 浏览

java - 无法使用锅炉管解析纽约时报文章

我正在尝试从“纽约时报”网址获取新闻文章,但它没有提供任何输出,但如果我尝试任何其他报纸,它会提供输出。我想知道我的代码是否有问题或锅炉管道无法获取它。另外,有时输出不是英语,这意味着它主要以 unicode 显示“每日新闻”,我也想知道原因。导入 java.io.InputStream;导入 java.net.URL;

0 投票
0 回答
53 浏览

java - 我清理了所有项目,现在当我尝试运行时出现错误:找不到或加载主类?

我想使用锅炉管,所以我将所有 .jars 添加到我的项目的构建路径中。我做了

在我的一种方法中

Eclipse 告诉我,即使我在“引用的库”下看到 DefaultExtractor.java,也无法解析导入。有人建议我清理所有项目。我做到了,现在当我尝试运行时,我收到一条错误消息:

我如何做到这一点,以便我能够再次运行我的代码?一旦我这样做了,我怎样才能让锅炉管工作?谢谢你。

0 投票
1 回答
79 浏览

java - 我直接在我的src文件夹中添加了一个库,Eclipse似乎可以正确编译,但是找不到类文件?

我将锅炉管库直接添加到我的 src 文件夹中。当我运行时,一切似乎都在编译,但我收到一条错误消息,告诉我锅炉管库中的一个类无法解析。

ArticleExtractor 类是我正在尝试使用的,但即使它的类文件位于 bin 文件夹中,Eclipse 也不会让我使用。

我会张贴图片,但我没有声誉。Boilerpipe 本身是一个包含其他几个文件夹的文件夹,在我尝试运行后,包含源文件夹中的 .java 文件和 bin 文件夹中的 .class 文件。我在这里找不到任何东西,所以我想问一下。