我正在开发一个旅游指南网站。我想要做的是阅读用户的 Facebook 签到并标记他们访问的位置(保存在我的数据库中,并使用从谷歌收集的坐标)。
我的问题是如何最好地将保存在我的数据库中的位置与 facebook 给出的位置进行比较。坐标不完全匹配,并且在许多情况下,facebook 上的名称以多种变体形式保存。
我正在将 neo4j db 与 php 一起使用。
我正在开发一个旅游指南网站。我想要做的是阅读用户的 Facebook 签到并标记他们访问的位置(保存在我的数据库中,并使用从谷歌收集的坐标)。
我的问题是如何最好地将保存在我的数据库中的位置与 facebook 给出的位置进行比较。坐标不完全匹配,并且在许多情况下,facebook 上的名称以多种变体形式保存。
我正在将 neo4j db 与 php 一起使用。
所以这就是我想出的。希望它可以帮助某人。
首先,我选择了一些坐标差小于 0.25 的目的地。您可以根据需要调整此值。我的密码查询如下所示:
START n = node:Destination('*:*')
WHERE has( n.lat ) AND has( n.long ) AND ABS(n.lat - ".$value['place']['location']['latitude'].") < 0.25 AND ABS(n.long - ".$value['place']['location']['longitude'].") < 0.25
RETURN n, ABS(n.lat - ".$value['place']['location']['latitude']."), ABS(n.long - ".$value['place']['location']['longitude'].")
然后我用levenshtein()函数计算“Levenshtein 距离”(将 str1 转换为 str2 时必须替换、插入或删除的最小字符数。)并仅选择该值小于字符串长度/2 的那些。该值也可以根据您的需要进行调整。这是代码:
foreach( $nodes as $key2 => $value2 ){
$name1 = strtolower($value2['x']->getProperty('name'));
$name2 = strtolower($value['place']['name']);
$name2 = explode( ",", $name2 );
$name2 = $name2[0];
$similarity = levenshtein($name1, $name2);
if( abs($similarity) <= intval(strlen($name1)/2) ){
array_push($similarityArray,$value2);
}
}
在此之后,我通过选择最近的位置来缩小范围,就像这样:
$minDifference = 0.4;
foreach( $similarityArray as $key2 => $value2 ){
if( $minDifference > ($value2[1]+$value2[2]) ){
$minDifference = ($value2[1]+$value2[2]);
$minKey = $key2;
}
}
该位置很可能是具有密钥 $minKey 的位置。