我想知道是否有任何方法/工具可以将 HTML 文件转换为其等效的 RDF 文件。
提前谢谢。非常感谢您的帮助。
没有来自任意 HTML 的标准等效 RDF 表示。如果您有高度规则的页面,您可以使用 XSLT 或简单的 XML 解析来从它们中抓取 RDF。iirc,这就是 DBPedia 项目最初获取数据的方式,通过抓取格式往往非常规则的维基百科页面,尤其是每个页面上的侧框。
但在一般情况下,这是不可能的。您可能感兴趣的一件事是RDFa,它是关于如何在 HTML 中嵌入RDF 的 w3c 标准。
没有正式的方法可以做到这一点。XHTML 词汇表有一个名称空间:
http://www.w3.org/1999/xhtml/vocab#
以及 XHTML 的命名空间
这可能需要一些 HTML 元素的 uri,无论是属性还是类。你也可以使用 Dublin Core 的点点滴滴。