0

查找 Wikipedia 英文文章的完整列表及其相关文章的其他语言(如法语和西班牙语)是一个问题,他们对此无能为力。您可以找到一些类似的问题,但其中大多数与维基百科以前的结构有关,而其他问题则没有正确答案。

我们可以从这里下载维基百科英语和西班牙语文章的转储文件: 英语维基西班牙语维基

在 enwiki 和 eswiki 中有一些名为 langlinks aka sitelinks 的数据,旨在查找与跨语言相关的文章。但不清楚如何使用它们来查找跨语相关文章(与每篇英文相关的西班牙语文章)。langlinks 模式如下:

CREATE TABLE `langlinks` (
  `ll_from` int(10) unsigned NOT NULL DEFAULT '0',
  `ll_lang` varbinary(20) NOT NULL DEFAULT '',
  `ll_title` varbinary(255) NOT NULL DEFAULT '',
   UNIQUE KEY `ll_from` (`ll_from`,`ll_lang`),
   KEY `ll_lang` (`ll_lang`,`ll_title`)
) ENGINE=InnoDB DEFAULT CHARSET=binary;

英语中具有特殊“ll_from”字段的记录是否与西班牙语中具有类似“ll_from”字段的记录相关?如果是,为什么在这两个 langlinks 文件中找不到具有相似 ll_from 字段的记录?

同样,如何使用这些 langlinks 文件来查找与跨语言相关的文章?我不想使用其他工具,例如 Wikidata 工具包。

4

1 回答 1

0

此页面很有帮助:手册:langlinks 表

引用页面的字段 ll_from page_id。

ll_lang 目标的语言代码,在 ISO 639-1 标准中。

ll_title 目标的标题,包括命名空间(FULLPAGENAMEE 样式)。

正如它在模式中显示的那样,ll_lang 和 ll_title 的组合是独一无二的。

于 2018-02-18T11:08:48.513 回答