iso.org 出售它们,但仅 ISO 639-1 代码的价格为 140 美元。这太荒谬了。此外,维基百科说巴西葡萄牙语的 ISO 639-1 代码是“pt-BR”,但 ISO 693-1 标准仅使用 2 个字母。谁能解释这背后的原因?
4 回答
您可以从国会图书馆网站获取 ISO639-1 代码的完整列表,作为 SKOS 概念 (rdf) 的各种格式:http: //id.loc.gov/vocabulary/iso639-1.html ISO639-2 是网站上还提供了更完整的 3 字母国家代码列表(超过 500 对 iso639-1 的 180)。
您提到的巴西葡萄牙语“pt-BR”代码实际上不是ISO639-1代码,而是由葡萄牙语“pt”的ISO639-1代码和巴西“BR”的ISO3166-1国家代码组成的复合代码. 这些结合遵循 RFC5646 中定义的最佳实践:https ://www.rfc-editor.org/rfc/rfc5646 。
好消息是,正如您在 RFC5646 中看到的那样,有一个标准来表示“巴西所说的葡萄牙语”:“pt-BR”,因此任何想要将某些内容标记为巴西葡萄牙语的人都会以这种方式构建标签。坏消息是,到目前为止,我还找不到这些定义为资源的权威列表:(希望这会有所帮助!
这是包含 ISO 639-1、ISO 639-2b、ISO-639-2t、ISO-639-3 语言列表的csv文件。它包含我认为世界上所有现有语言的列表。我从language_list gem中检索到它
我推荐datasets/language-codes
github repo。
我在Oracle 的网站上找到了一个包含最常用语言的小型列表,它是 ISO 639-1 代码。
维基百科有一个更完整的列表,有 555 个条目,ISO 639-1,2,3 和 5,范围和类型。