2

我下载了一个应该是 RDF 格式的数据集 http://iw.rpi.edu/wiki/Dataset_1329,使用记事本++我打开它但无法读取它。有什么建议么?

4

2 回答 2

2

未压缩的文件大约为 140MB。Notepad++ 可能由于文件的大小而失败。该数据集中使用的 RDF 格式是Ntriples,每行一个三元组,包含三个组件(主语、谓语、宾语),非常易于阅读。文件中的示例数据:

<http://data-gov.tw.rpi.edu/raw/1329/data-1329-00017.rdf#entry8389> <http://data-gov.tw.rpi.edu/vocab/p/1329/race_other_multi_racial> "0" .
<http://data-gov.tw.rpi.edu/raw/1329/data-1329-00017.rdf#entry8389> <http://data-gov.tw.rpi.edu/vocab/p/1329/race_black_and_white> "0" .
<http://data-gov.tw.rpi.edu/raw/1329/data-1329-00017.rdf#entry8389> <http://data-gov.tw.rpi.edu/vocab/p/1329/national_origin_hispanic> "0" .
<http://data-gov.tw.rpi.edu/raw/1329/data-1329-00017.rdf#entry8389> <http://data-gov.tw.rpi.edu/vocab/p/1329/filed_cases> "1" .

如果您想查看数据,请尝试使用流式传输文件的工具打开它,而不是一次全部加载,例如lesshead.

如果您想使用数据,您可能需要考虑将其加载到三重存储(4store、Virtuoso、Jena TDB...)中并使用SPARQL来查询它。

于 2012-01-30T17:13:56.887 回答
-1

试试Google Refine(可能带有 RDF 扩展: http: //lab.linkeddata.deri.ie/2010/grefine-rdf-extension/

于 2012-01-30T14:28:51.497 回答