I/P 文件 : doc,docx with en-dash,em-dash
我已经通过使用 Apache Tika(元数据属性)和 Aspose wordtojava(library) 实现了字数统计功能,但它们没有给我准确的字数统计结果。
en-dash 和 em-dash 字数与 MS-Office ex 不同。2-3 4-5 结果:MS-office 给出上述示例的字数 4 APache - Tika & Aspose 库给出字数 2
如何计算与 MS-Office 相同的正确字数?
任何帮助都是非常可观的。
需要快速响应。
谢谢