我知道 Apache Tika 是一个文本提取器。它可以从 doc、pdf、ppt 和许多其他文件格式中提取文本。现在我在 ios 中需要这个功能,所以我想知道 Apache Tika for ios 有什么替代品吗?
如果 ios 没有这样的库,你可以告诉我可以提取指定文件格式的工具。
先感谢您。
我知道 Apache Tika 是一个文本提取器。它可以从 doc、pdf、ppt 和许多其他文件格式中提取文本。现在我在 ios 中需要这个功能,所以我想知道 Apache Tika for ios 有什么替代品吗?
如果 ios 没有这样的库,你可以告诉我可以提取指定文件格式的工具。
先感谢您。
libopc用于从 docx、xlsx、pptx 中提取文本。
您也可以使用 CoreGraphics 从 PDF 中提取字符串,也可以使用PDFiPhone。
如果您还想从 HTML 文档中提取文本,请查看NSXMLParser。