1

我有一个 .nq 文件,我想将其加载到 Fuseki 三重存储中,但出现以下错误:

Exception in thread "main" org.apache.jena.atlas.AtlasException: java.nio.charset.MalformedInputException: Input length = 1
at org.apache.jena.atlas.io.IO.exception(IO.java:206)
at org.apache.jena.atlas.io.CharStreamBuffered$SourceReader.fill(CharStr
eamBuffered.java:77)
at org.apache.jena.atlas.io.CharStreamBuffered.fillArray(CharStreamBuffe
red.java:154)
at org.apache.jena.atlas.io.CharStreamBuffered.advance(CharStreamBuffere
d.java:137)
at org.apache.jena.atlas.io.PeekReader.advanceAndSet(PeekReader.java:243
)
   at org.apache.jena.atlas.io.PeekReader.init(PeekReader.java:237)
   at org.apache.jena.atlas.io.PeekReader.peekChar(PeekReader.java:159)
   at org.apache.jena.atlas.io.PeekReader.makeUTF8(PeekReader.java:100)
   at org.apache.jena.riot.tokens.TokenizerFactory.makeTokenizerUTF8(Tokeni
zerFactory.java:41)
   at org.apache.jena.riot.RiotReader.createParser(RiotReader.java:131)
   at org.apache.jena.riot.RDFParserRegistry$ReaderRIOTFactoryImpl$1.read(R
DFParserRegistry.java:141)
   at org.apache.jena.riot.RDFDataMgr.process(RDFDataMgr.java:859)
   at org.apache.jena.riot.RDFDataMgr.parse(RDFDataMgr.java:687)
   at org.apache.jena.riot.RDFDataMgr.parse(RDFDataMgr.java:666)
   at org.apache.jena.riot.RDFDataMgr.parse(RDFDataMgr.java:654)
   at com.hp.hpl.jena.tdb.store.bulkloader.BulkLoader.loadQuads$(BulkLoader
.java:149)....

是否可以将 .nq 文件加载到 fuseki 中?我使用以下命令:

tdbloader --loc=data articles.nq

我的 Jena 版本是 apache-jena-2.11.2,fuseki 版本是 jena-fuseki-1.0.2。

提前致谢!

4

1 回答 1

4

您可以加载 N-Quads。

问题是数据不是UTF-8。

articles.nq.gz 似乎是数据 gzip 的 gzip 文件。两级gzip。

运行一次 gzip 会留下一个二进制文件,而不是 N-quads。

真实数据非常混乱,但有警告(据我所知)。

于 2014-06-25T17:40:51.760 回答