Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我需要从 xls 文件中提取文本以进行索引。这只是索引要求,因此格式、宏表等无关紧要,
使用 xlhtml 非常繁重,并且严重降低了索引能力。
这种转换的最佳方式是什么?
我使用 tika http://tika.apache.org/ 作为守护进程。现在效果好多了