我已经使用 MLCP(MarkLogic Content Pump)成功地将一个非常干净(简单的英语,没有花哨的符号或图像)的 CSV 文件加载到 MarkLogic 中,以便它将第一行作为列名,当我尝试加载它不干净的东西(即与其他语言和编码混合)它会失败。
我从摄取指南 ( http://docs.marklogic.com/guide/ingestion/encoding?print=yes ) 中了解到,MLCP 无法控制编码,因此我决定尝试使用 Java API 和 xdmp Xquery。
使用 Java API 时,我得到:第 1549 行的无效 UTF-8 转义序列——文档不是 UTF-8 编码的
如果我尝试在 Query Console 或 Information Studio 的流中使用 xdmp 自动编码加载它,它会毫无问题地加载,但 MarkLogic 不会将第一行作为列名,而是将整个文件作为一个文档,这不是我要找的。
有没有办法在没有编码问题的情况下加载 CSV 文件并将其作为列名放在第一行?
提前致谢。