0

我已经下载了 yago.n3 数据集

但是,对于测试,我希望使用较小版本的数据集(因为数据集是 2 GB),即使我做了一个小改动,也需要花费大量时间来调试。

因此,我尝试复制一小部分数据并创建一个单独的文件,但这不起作用并引发了词汇错误。

我看到了较早的帖子,但是较早的帖子是关于大数据集的,而我正在寻找较小的数据集。

有什么方法可以让我获得少量的相同数据集?

4

1 回答 1

3

如果您手头有一个 RDF 解析器来读取您的 yago.n3 文件,您可以解析它并在一个单独的文件上写入您想要/需要的多个 RDF 三元组,以便您的较小数据集运行您的实验。

如果您发现一些 N-Triples 格式的数据(即每行一个 RDF 三元组),您可以根据需要取任意多行,并使数据集尽可能小:head -n 10 filename.nt 会给您一个很小的10 个三元组的数据集。

于 2012-05-25T06:20:26.480 回答