如何找到所有非维基数据链接到英语-维基导游文章的德语-维基导游文章?
例如:
- https://de.wikivoyage.org/wiki/Calabash_Bay(甚至没有出现在 Wikidata 上)
- https://de.wikivoyage.org/wiki/Cecina https://www.wikidata.org/wiki/Q157762
可以在 Python 中,但 bash 或任何工具甚至 HTTP 请求都可以,越简单越好。
如何找到所有非维基数据链接到英语-维基导游文章的德语-维基导游文章?
例如:
可以在 Python 中,但 bash 或任何工具甚至 HTTP 请求都可以,越简单越好。
我认为最好的方法是为此访问 SQL 数据库。
为此,您可以在Tool Labs上获得一个帐户,也可以下载数据库必要表的转储(此处为langlinks
and page
),然后将它们导入本地 MySQL 数据库。
查询看起来像:
select page_title
from page
where not exists
(select * from langlinks where ll_from = page_id and ll_lang = 'en')
and page_namespace = 0
and page_is_redirect = 0
此列表也不包含使用旧(页内)方法具有指向英语维基导游的语言链接的页面,但我相信这些应该很少见。
Magnus Manske在其他语言中的 Not可以做到这一点,并输出一个包含大约 12k 个项目的整洁的 PagePile 。
如果您还想包含一些尚未在 Wikidata 上的文章,则可以使用相关工具。