1

我正在尝试使用字符串字段将文档存储到 Vespa 中。使用 document-api http 端点时,它会因解析错误而被拒绝。我已经验证正在发送正确的 JSON(其他文档正常)。

这是我看到的错误消息:

PARSER_ERROR Error in document 'id:x:y:n=1:1FVzo2l7mMLticB0WMkBKIECMLzAg' - could not parse field 'content' of type 'string': The string field value contains illegal code point 0xB

我可以看到对这些类型的字符(在我的情况下为垂直选项卡)进行了检查com.yahoo.text.TextallowedAsciiChars但我在文档中没有看到我应该在发送到 Vespa 之前剥离这些字符的任何地方。事实上,我看到了一种相反的情况,即 Vespa 会不遗余力地在幕后替换某些字符而不拒绝它们。

4

2 回答 2

2

请在送纸前从文件中去除 ASCII 控制字符。

我会更新文档,虽然似乎JSON 规范说这些控制字符必须被转义,所以这些在提要中是隐式不允许的

于 2019-01-05T09:40:12.950 回答
1

我看到了一种相反的情况,即 Vespa 会不遗余力地在幕后替换某些字符

你在哪里看到这个?

有一个 Text.stripInvalidCharacters 实用程序方法作为 Java 客户端的实用程序提供,这些客户端需要从未净化的文本中去除字符。

于 2019-01-07T09:33:37.720 回答