3

我有一些 RDF 文件要导入到tripplestore(AllegroGraph) 中,但是在第一个文件中我得到一个SAX 解析器错误,指出存在无法识别的字符。删除有问题的线路后,一切都很好。然后我尝试在带有错误行的 RDF 上使用 W3C RDF 验证器和 Jena,但我得到的只是一些关于未定义语言的警告(绝对没有关于错误行的内容)。您能否建议一种方法(如果可能,使用 java)来查找 RDF 文件中的错误?

编辑:有问题的行是:

<gn:alternateName xml:lang="got">&#66352;&#66374;&#66354;&#66352;&#66365;&#66361;&#66371;&#66372;&#66352;&#66365;</gn:alternateName>
4

1 回答 1

1

您可以使用 Sesame 的Rio 解析器进行验证。这篇博文中有关于如何使用 Rio 的一般说明。具体来说,对于验证,诀窍是创建并附加一个 ParseErrorListener,它从解析器接收详细的警告和错误。

但是,由于您提到您遇到的问题是在 SAX / XML 级别,您也可以只使用通用 XML 验证器来查看问题所在。最可能的原因(但如果没有更多细节很难说)是您在某处有一个错误编码的字符。

于 2011-11-16T01:13:14.227 回答