solr - 我必须在 xml 文件的某个位置找到一个字符，我该怎么办？

Question

我正在使用 Solr，它返回一个错误 500，它说在 char 139212 处有一个无效的 utf8 中间字节，我怎样才能去这个 char 看看有什么问题？

score 0 · Accepted Answer

如果您的文件系统上有文件，并且它是 Unix/Linux 类型的系统，您可以在命令行上尝试这样的操作：

$ head -c 139300 <filename> | tail -c 1000

这告诉head您想要文件中的前 139300 个字节。由于数字 139212 将接近结尾，您将能够在上下文中看到您的角色，或者至少弄清楚它所在的部分/块。因为这是大量数据，所以我添加| tail -c 1000了仅显示最后 1000 个前 139300 个字符的字节数。这应该使您不必通过终端滚动尽可能多的数据来查看结果。

如果您自己生成此 XML，我建议您添加 XML 验证或至少非法字符检测，这样您就可以避免将来出现问题。

solr - 我必须在 xml 文件的某个位置找到一个字符，我该怎么办？

1 回答 1

Related

Reference