0

我想获取不同语言的主要新闻网站列表。是否有任何提供商以 RDF 格式提供大部分主要网站详细信息?

4

1 回答 1

1

DBpedia 包含来自 Wikipedia 的信息,并具有 SPARQL 端点。维基百科中有一些相关类别可以帮助您找到您正在寻找的信息。例如,我们可以选择单个新闻站点并获得 302 个结果:

SELECT * WHERE { 
  ?newsSite dcterms:subject category:News_websites .
} 

SPARQL 结果

可靠地获取其他信息有点困难,因为某些信息可能不适用于页面,或者相同的信息可能存在于具有不同属性的不同页面上。例如,其中一些页面记录了他们的新闻站点dbpprop:web

SELECT * WHERE { 
  ?newsSite dcterms:subject category:News_websites .
  OPTIONAL { ?newsSite dbpprop:web ?web }
}

SPARQL 结果

其他人使用dbpprop:website. 您可以dbpprop:web将前面的查询替换为dbpprop:web|dbpprop:website,尽管这在 DBpedia 端点上运行速度有些慢。您可以更详细地使用它来代替:

SELECT ?newsSite ?web WHERE { 
  ?newsSite dcterms:subject category:News_websites .
  OPTIONAL { 
    { ?newsSite dbpprop:web ?web }
    UNION
    { ?newsSite dbpprop:website ?web }

  }
} 

SPARQL 结果

这仍然只能获取其中少数页面的网站。一些更多的用途dbpprop:url,所以我们有以下内容:

SELECT ?newsSite ?web WHERE { 
  ?newsSite dcterms:subject category:News_websites .
  OPTIONAL { 
    { ?newsSite dbpprop:web ?web }
    UNION
    { ?newsSite dbpprop:website ?web }
    UNION 
    { ?newsSite dbpprop:url ?web }
  }
} 

SPARQL 结果

于 2013-05-30T17:20:12.847 回答