我正在寻找用于文档预处理的库(和指南)。我的意思是,例如生成 PDF、MS Office (Excel/Word)、Open Office 格式文件。
我已经看到特别流行的 Apache POI 和 iText。您是否知道任何描述文档预处理库的书(对于 iText,我找到了“iText in Action”)?
我也想比较图书馆。
有什么线索吗?
我正在寻找用于文档预处理的库(和指南)。我的意思是,例如生成 PDF、MS Office (Excel/Word)、Open Office 格式文件。
我已经看到特别流行的 Apache POI 和 iText。您是否知道任何描述文档预处理库的书(对于 iText,我找到了“iText in Action”)?
我也想比较图书馆。
有什么线索吗?
对于文件格式本身,许多细节都可以在线获得。没有我知道的书。但这里有一些对一些办公文档文件格式的在线参考。
对于 Microsoft Office 文档(Word、Excel、PowerPoint),格式发布在 http://www.microsoft.com/openspecifications/en/us/programs/osp/office-file-formats/default.aspx 或 http:// msdn.microsoft.com/en-us/library/cc313105%28v=office.12%29.aspx
Microsoft 站点包含一些关于如何解析 Office 类型文件的示例,这些示例可能对您有用。
对于 Open Office,您可以查看 http://www.openoffice.org/xml/general.html 或 https://www.oasis-open.org/committees/tc_home.php?wg_abbrev=office
但以上内容更像是参考手册,而不是让您轻松解析这些文档的教程或库。