1

我有一个问题,我一直在努力解决我已经在谷歌上搜索了一些与我想做的事情相似的事情,但无法确切地知道如何去做,

我有大约 250M 的 IP 地址,我想对照 maxmind geolite2 数据进行查找,这样我就可以知道每个 IP 地址来自哪个国家,

我已经使用 talend 将所有数据导入到我的 Redshift 集群中,

table a has ID and 'ipaddress' ie 10.0.0.5
table b (maxmind) has country name and IP range as expressed as 10.0.0.0/24

考虑到源数据源的大小,我如何使用 Redshift SQL 来匹配这两者?

编辑:这是geolite2数据的链接https://dev.maxmind.com/geoip/geoip2/geolite2/

4

1 回答 1

3

您可以尝试使用 Amazon Redshift 的导入自定义 Python 库模块的功能来加载netaddr 库。然后,您可以在用 Python 编写的用户定义函数中使用该库。

另请参阅:Python 中 IP 范围到 CIDR 的转换?

于 2016-05-11T06:11:46.683 回答