像http://www.maxmind.com/这样的地理定位数据库从什么来源获取数据?据我了解,像 ARIN 和 RIPE 这样的 IP 注册位置只保存有关分配 IP 范围的公司的信息,所以它必须来自 ISP 的权利吗?如果是这样,则必须有某种访问方式。
2 回答
我有同样的问题,并找到了以下信息。
当我使用 MaxMind 信息时,我希望它们的有效性,他们的网站声明:“MaxMind 定期测试 GeoIP2 和 GeoIP Legacy 数据库的准确性。在我们最近的测试中,可下载的数据库在国家一级准确率为 99.8%,准确率为 90%在美国的州一级,对于半径50公里范围内的美国城市准确率为86%。更多详细信息,请参阅GeoIP2城市覆盖和准确率。MaxMind定期测试GeoIP2产品和服务中使用的数据的准确性。是通过根据 MaxMind 的 GeoIP2 Precision Web 服务以及 GeoIP2 City 和 GeoLite2 City 数据库产品中的数据检查已知的 Web 用户 IP 地址和位置对来计算的。”
对于 ISP 信息,他们表示:“ISP 名称在美国的准确率约为 95%。在美国以外,准确率在 50% 到 80% 之间,具体取决于国家/地区。对于互联网用户较多的国家/地区,数据通常更准确。 "
来源: https ://www.maxmind.com/en/geoip2-isp-database
至于该过程,以下答案似乎提供了丰富的信息:
IP地理定位数据库通常基于以下内容收集:
IP 爬取——跟踪路由和其他旨在映射 Internet 路由基础设施的自动化方法。考虑到任务(不断分配、解除分配或移动的 4 多亿个 IP 地址),这些技术可能相当复杂且耗时。此外,使用 IPv6,这变得更加困难。
与 IP 地址相关的用户提供的数据——一些公司获取与 IP 地址相关的匿名用户数据(邮政编码/城市),并使用这些数据来帮助填充他们的数据库。显然,需要仔细清理这些数据以确保其可靠。
与 ISP 共享关系。像我这样的公司(Digital Element... http://www.digitalelement.com/)经常被 ISP 联系以确保我们的数据是准确的,因为他们不希望他们的用户被错误地定位为诸如此类的服务的目标Hulu 或 ESPN,并且可能在他们应该能够获得内容时被阻止。这些数据通常是高度准确的,假设它是最新的,因为 ISP 完全了解他们自己的 IP 地址的位置。
注册表数据——查看 ARIN、RIPE 等。[通常不那么准确。] \
有许多 MAXMIND 数据库,有些是免费的,有些是商业许可的。这些数据库中的信息部分来自其他公共数据库,例如 RIPE,部分来自 MAXMIND 的内部处理/匹配。
如果需要,您可以编写自己的工具来解析 RIPE 数据库、提取所有字段并构建自己的数据库,或者您可以向已经做过的人付费。
如果您要以编程方式查询他们的数据库,dev.maxmind.com 上提供了适用于大多数语言的 API。
请注意 - 如果您使用 MAXMIND GeoASN 数据库从 IP 查找 ASN,则 AS 名称不一定与与给定 IP 关联的 ISP 名称匹配。(例如,AS2856 可解析为许多不同的组织,包括 BT 和 TalkTalk)。这就是为什么 GeoISP 数据库使用 IP 地址范围而不是 ASN 的原因。
-- ab1