1

大家好,我一直在寻找足够大的语义数据集来对我正在开发的算法进行一些测试。

我的意思是一个已经存在的 RDF/XML 文件,我可以“轻松”上传到 AllegroGraph。我发现了几个虚拟数据集,但它们使用了不切实际的数据,如“char1”、“char2”、“node121”等。起初还可以。

但现在我需要使用关于真实事物的数据集进行测试,无论是汽车、植物、电影、书籍等。几个组合将是理想的。特别是一个具有超过 50k 个对象且至少具有 3 或 4 个方面的对象。有人告诉我这些数据集在某个地方,但我找不到它们。

欢迎任何链接、指针或建议。此外,如果有更好的网站来发布这个问题,我会听从建议。

4

1 回答 1

1

在寻找更多时间后,我遇到了一个非常好的选择。那就是DBpedia.org 他们从维基百科收集所有数据并将其划分为特定部分。为了我的测试目的,我很可能会使用我想我的问题是我仍然熟悉这些概念以及如何在语义网络方面搜索我想要的东西。希望这个链接能帮助更多的人:)

于 2011-05-21T02:46:47.910 回答