0

我知道 Apache Tika 是一个文本提取器。它可以从 doc、pdf、ppt 和许多其他文件格式中提取文本。现在我在 ios 中需要这个功能,所以我想知道 Apache Tika for ios 有什么替代品吗?

如果 ios 没有这样的库,你可以告诉我可以提取指定文件格式的工具。

先感谢您。

4

1 回答 1

2

libopc用于从 docx、xlsx、pptx 中提取文本。

旧 MS 格式的Antiword

您也可以使用 CoreGraphics 从 PDF 中提取字符串,也可以使用PDFiPhone

如果您还想从 HTML 文档中提取文本,请查看NSXMLParser

于 2012-09-05T11:41:50.920 回答