我正在尝试使用 xdmp:word-convert() 函数转换我的二进制文档(DOCX 文件),它向我抛出了以下错误。
您尝试转换的文件格式不正确。DHF-INVFILE: xdmp:word-convert(fn:doc("/content/aplc/binary/13599668870066633077.docx"), "13599668870066633077.docx", <options xmlns:tidy="xdmp:tidy" xmlns="xdmp: word-convert"><tidy>true</tidy>...</options>) -- 您尝试转换的文件格式不正确。输入=/var/opt/MarkLogic/Temp/0b71d7278e82c553/toconv.doc
我的代码如下
xdmp:word-convert(
$xml-input,
fn:concat(xdmp:hash64("Sample.docx"),".docx"),
<options xmlns="xdmp:word-convert" xmlns:tidy="xdmp:tidy">
<tidy>true</tidy>
<tidy:clean>yes</tidy:clean>
<tidy:drop-empty-paras>yes</tidy:drop-empty-paras>
<tidy:drop-font-tags>yes</tidy:drop-font-tags>
<tidy:hide-comments>yes</tidy:hide-comments>
<tidy:output-html>no</tidy:output-html>
<tidy:output-xhtml>no</tidy:output-xhtml>
<tidy:output-xml>yes</tidy:output-xml>
<compact>true</compact>
</options>)
相同的代码与 .doc 扩展一起工作得很好
如果 xdmp:word-convert() 不能与 DOCX 文件一起使用,那么除了 xdmp:document-filter 之外,还有哪些其他可能的 API 函数可以完成类似的工作。