1

我可以知道如何使用 Tika 提取网页中表格形式的数字等信息吗?Tika 有为此目的的解析器吗?

谢谢

4

1 回答 1

0

好吧,您可以在 tika 中提取网页。为此,您可以使用apache-tika's HTMLParser. 你会在这里得到你需要的一切

那么你也可以使用AutoDetectParserwhich will autodetect content type and extract contentAutoDetectParser可以检测任何类型的文件/网址并将应用提取。

我可以知道如何使用 Tika 提取网页中表格形式的数字等信息吗?

--> tika 提取的内容就像一个raw文本。我认为您不会以表格形式获得它。

于 2012-08-16T06:21:33.010 回答