查找 Wikipedia 英文文章的完整列表及其相关文章的其他语言(如法语和西班牙语)是一个问题,他们对此无能为力。您可以找到一些类似的问题,但其中大多数与维基百科以前的结构有关,而其他问题则没有正确答案。
我们可以从这里下载维基百科英语和西班牙语文章的转储文件: 英语维基和西班牙语维基。
在 enwiki 和 eswiki 中有一些名为 langlinks aka sitelinks 的数据,旨在查找与跨语言相关的文章。但不清楚如何使用它们来查找跨语相关文章(与每篇英文相关的西班牙语文章)。langlinks 模式如下:
CREATE TABLE `langlinks` (
`ll_from` int(10) unsigned NOT NULL DEFAULT '0',
`ll_lang` varbinary(20) NOT NULL DEFAULT '',
`ll_title` varbinary(255) NOT NULL DEFAULT '',
UNIQUE KEY `ll_from` (`ll_from`,`ll_lang`),
KEY `ll_lang` (`ll_lang`,`ll_title`)
) ENGINE=InnoDB DEFAULT CHARSET=binary;
英语中具有特殊“ll_from”字段的记录是否与西班牙语中具有类似“ll_from”字段的记录相关?如果是,为什么在这两个 langlinks 文件中找不到具有相似 ll_from 字段的记录?
同样,如何使用这些 langlinks 文件来查找与跨语言相关的文章?我不想使用其他工具,例如 Wikidata 工具包。