我正在使用 Solr,它返回一个错误 500,它说在 char 139212 处有一个无效的 utf8 中间字节,我怎样才能去这个 char 看看有什么问题?
问问题
70 次
1 回答
0
如果您的文件系统上有文件,并且它是 Unix/Linux 类型的系统,您可以在命令行上尝试这样的操作:
$ head -c 139300 <filename> | tail -c 1000
这告诉head
您想要文件中的前 139300 个字节。由于数字 139212 将接近结尾,您将能够在上下文中看到您的角色,或者至少弄清楚它所在的部分/块。因为这是大量数据,所以我添加| tail -c 1000
了仅显示最后 1000 个前 139300 个字符的字节数。这应该使您不必通过终端滚动尽可能多的数据来查看结果。
如果您自己生成此 XML,我建议您添加 XML 验证或至少非法字符检测,这样您就可以避免将来出现问题。
于 2014-05-16T16:14:27.213 回答