我有一个与某些实体相关的维基百科页面列表,我只想选择地理位置和位置(城市、省,还有地区、山脉、河流等)。
我可以轻松地选择带有坐标的页面,但这还不够,因为 Wikipedia 中的许多地方实际上与它们的坐标无关。我想我应该使用 Wikidata 中的标签,但我从未使用过它们,而且我对 Python API 有点迷茫。例如,如果我使用 wptools:
import wptools
page = wptools.page('Indianapolis')
print(page.get_wikidata())
我得到这个:
www.wikidata.org (wikidata) Indianapolis
www.wikidata.org (labels) Q1000136|P1830|P421|Q1093829|P163|Q2579...
www.wikidata.org (labels) Q537853|P281|P949|Q2494513|Q3166162|Q18...
www.wikidata.org (labels) P1036|Q499547|P1997|P31|P17|P268|Q62049...
en.wikipedia.org (imageinfo) File:IndianapolisC12.png
Indianapolis (en) data
{
aliases: <list(10)> Circle City, Indy, Naptown, Crossroads of Am...
claims: <dict(61)> P1082, P227, P1151, P31, P17, P131, P163, P41...
description: <str(109)> city in and county seat of Marion County...
image: <list(1)> {'file': 'File:IndianapolisC12.png', 'kind': 'w...
label: Indianapolis
labels: <dict(145)> Q1000136, P1830, P421, Q1093829, P163, Q2579...
modified: <dict(1)> wikidata
requests: <list(5)> wikidata, labels, labels, labels, imageinfo
title: Indianapolis
what: county seat
wikibase: Q6346
wikidata: <dict(61)> population (P1082), GND ID (P227), topic's ...
wikidata_pageid: 7459
wikidata_url: https://www.wikidata.org/wiki/Q6346
}
我怎样才能只提取标签?我想存在一个标签“这是一个位置”但是如何使用它?提前致谢