5

我正在寻找一种通用的 API/Web 服务/工具/等...,它允许将给定的 HTML 页面转换为尽可能具体的 RDF 图(很可能使用骨干本体和/或映射器)。

4

3 回答 3

2

你证明了GRDDL吗?

GRDDL 是一种从 XML 文档尤其是 XHTML 页面获取 RDF 数据的技术。

于 2010-03-05T13:36:00.143 回答
2

我使用 XQuery 从给定的网页集中提取数据。我必须为网页编写自定义查询。我认为这是对一组特定的 HTML 文件采取的最直接的方法。但是,对于一般情况来说,显然是不好的。对于一组不同的网页,需要编写其他自定义查询。

于 2010-04-09T18:48:51.217 回答
0

我使用 JSoup 从 HTML 中抓取数据。它使用 jQuery 样式的 HTML DOM 查询,我已经很熟悉了,所以它对我来说是非常简单的工具。我也为它提供了相当强大的资金,但我只需要它来抓取 3 个数据源,所以我对这个工具还没有丰富的经验。

于 2013-12-07T20:34:49.763 回答