我有一个格式如下的 RDF/XML 文件(截断以仅显示必要的数据):
<rdf:RDF xml:base="http://www.gutenberg.org/">
<pgterms:ebook rdf:about="ebooks/48666">
<pgterms:downloads rdf:datatype="http://www.w3.org/2001/XMLSchema#integer">34</pgterms:downloads>
<dcterms:creator>
<pgterms:agent rdf:about="2009/agents/36363">
<pgterms:deathdate rdf:datatype="http://www.w3.org/2001/XMLSchema#integer">1926</pgterms:deathdate>
<pgterms:webpage rdf:resource="http://en.wikipedia.org/wiki/Edmund_Candler"/>
<pgterms:alias>Chandler, Edmund</pgterms:alias>
<pgterms:birthdate rdf:datatype="http://www.w3.org/2001/XMLSchema#integer">1874</pgterms:birthdate>
<pgterms:name>Candler, Edmund</pgterms:name>
</pgterms:agent>
</dcterms:creator>
<dcterms:title>The Sepoy</dcterms:title>
<dcterms:subject>
<rdf:Description rdf:nodeID="Nd62b88adeb1347d9b99ba9d763e74269">
<dcam:memberOf rdf:resource="http://purl.org/dc/terms/LCSH"/>
<rdf:value>Soldiers -- India -- Conduct of life</rdf:value>
</rdf:Description>
</dcterms:subject>
</pgterms:ebook>
</rdf:RDF>
我想从此文件中检索某些属性,例如:
- 书名: Sepoy
- 创作者 - 姓名: Candler, Edmund
- 下载: 34
- 主题-价值: 士兵--印度--生活行为
我已经确定 SPARQL 很可能是我从事这类工作所需的技术,但我没有使用 RDF 的经验,并且对这些数据的格式感到很困惑。如何解析此文件以在 python 中检索所需的信息?