我有一个带有一些(经纬度)坐标的大日志文件,以及一个带有多边形集合的数据库。多边形数据集现在适合内存,但将来可能不适合。
我想加入这两个数据集,以便知道对于每个日志坐标,它包含在哪些多边形中。
你知道使用 Hadoop(或 Pig,如果有帮助的话)解决这个问题的好方法是什么吗?
我有一个带有一些(经纬度)坐标的大日志文件,以及一个带有多边形集合的数据库。多边形数据集现在适合内存,但将来可能不适合。
我想加入这两个数据集,以便知道对于每个日志坐标,它包含在哪些多边形中。
你知道使用 Hadoop(或 Pig,如果有帮助的话)解决这个问题的好方法是什么吗?