Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我已经下载了 yago.n3 数据集
但是,对于测试,我希望使用较小版本的数据集(因为数据集是 2 GB),即使我做了一个小改动,也需要花费大量时间来调试。
因此,我尝试复制一小部分数据并创建一个单独的文件,但这不起作用并引发了词汇错误。
我看到了较早的帖子,但是较早的帖子是关于大数据集的,而我正在寻找较小的数据集。
有什么方法可以让我获得少量的相同数据集?
如果您手头有一个 RDF 解析器来读取您的 yago.n3 文件,您可以解析它并在一个单独的文件上写入您想要/需要的多个 RDF 三元组,以便您的较小数据集运行您的实验。
如果您发现一些 N-Triples 格式的数据(即每行一个 RDF 三元组),您可以根据需要取任意多行,并使数据集尽可能小:head -n 10 filename.nt 会给您一个很小的10 个三元组的数据集。