我正在尝试制作一个关于在我所在地区(10k,半程马拉松,马拉松)进行比赛的语义网络应用程序。更具体地说,我想收集和发布(在 RDF 中)关于比赛、参与者和结果的数据,并合并类似的数据。过去几周我一直在测试 Jena(包括 TDB),从静态网站上抓取一些关于跑步比赛的网页,并阅读有关词汇和本体的信息。
我认为用于我的应用程序的最有信誉的本体,也是进入门槛最低的本体(不是非常过度设计),是 BBC 体育本体。 http://www.bbc.co.uk/ontologies/sport/2011-02-17.shtml
我有几个关于使用 BBC Sports 和制作应用程序的问题:
即使我只使用其中的一小部分,我也可以使用 BBC 体育本体吗?
我想查看本体的架构以更好地理解它,但我似乎无法在任何地方找到它。BBC 是保密还是我只是在错误的地方寻找它?
有什么方法可以让我确定我是否正确使用了本体?我的母语不是英语,所以我担心我可能会误解本体中的一些概念。
当我将新的三元组添加到我的 (TDB) 三元组存储时,为资源创建新 URI 的约定是什么?更具体地说,URI 应该以名称还是 uid 结尾?这会影响合并来自不同数据集的相似数据吗?
您能否推荐任何语义 Web 工具来使资源 URI 可取消引用?我不会很快将应用程序放到网络上,但是如果我可以在本地访问 URI 仍然会很好,例如
http://localhost/running/12345.